Специалисты по данным из Tumblr и Kickstarter признаются в одном большом лохе

  • 01-01-2021
  • комментариев

Собираются специалисты по данным. (Фото: Livestream)

DataGotham в настоящее время разворачивается в центре Нью-Йоркского университета в Стерне, и около обеда состоится круглый стол, чтобы обсудить, каково это быть первым специалистом по данным в компании. Среди участников дискуссии были Адам Лайакано из Tumblr, Фред Бененсон из Kickstarter и Роберто Медри из Etsy. Общие знаменатели, по мнению модератора Хилари Мейсон? «Любовь к математике, любопытство и большое упрямство».

Большая часть дискуссий вращалась вокруг самых скучных тем из науки о данных, включая R, SQL и т. Д. Но самое приятное было, когда каждый из участников дискуссии - по подсказке мисс Мейсон - признался в чем-то, что пошло не так, как надо. Не только потому, что всем нравятся хорошие ролики с ляпами, но и потому, что они дают довольно хорошее представление о том, чем на самом деле занимаются специалисты по данным.

Мистер Лайакано, который до того, как присоединился к сайту микроблогов, разработал атомные часы, признал, что у Tumblr есть небольшая проблема со спамом. Он написал несколько «довольно хороших» классификаторов для поиска того, что действительно возникает, хотя бывают и ложные срабатывания. Но время от времени появляются сообщения: «Я уверен, что это спам». И однажды он признался: «Я случайно заблокировал сотни, а может и тысячу пользователей за один день».

Возможно, мы только что раскрыли тайну пропавших без вести сайтов NSFW!

«Мне очень жаль», - добавил он, выглядя настолько робким, насколько это возможно для бородатого взрослого. (То есть очень.)

Mr. Бененсон признался, что однажды он провел пару часов в панике из-за того, что различные отделы и сотрудники Kickstarter путали цифры в его внутреннем отчете - медианное обещание - с цифрами, предоставленными внешнему миру - популярное обещание.

< p> «Я такой, ну вот, надеюсь, они такие же». После набора цифр его успокоили, но «это был один из таких моментов, как… общение! Мы должны внести ясность », - сказал он.

Г-н Медри из Etsy (который, помимо своего таланта в области даталогии, специализировался на« мертвых языках »в качестве студента) понял, что их внутренние отчеты содержат то, что может быть наименее полезным точка данных за все время: страница с самым большим «коэффициентом конверсии» была страницей справки, потому что люди, которые что-то заказывали, как правило, ищут дополнительные сведения. Он мало что дал практической информации. Они скорректировались соответственно.

Большое спасибо господину Лайакано за то, что он был единственным человеком, достаточно смелым, чтобы не скомпрометировать свой ответ.

Однако участники дискуссии не просто опозорились. У них также была возможность показать, как их сверхъестественные навыки помогли изменить мир к лучшему.

Mr. Лайакано признал, что многое из того, что он делал, было не внутренним делом, а тем, что мир может увидеть. Однако он помог отслеживать данные об использовании клиентами, то есть то, как пользователи перемещаются по сайту, чтобы продемонстрировать, что лучший способ реорганизовать настройки - это поместить их в одно место. Звучит просто, но для этого нужно обрабатывать огромное количество данных, но «Люди реагируют намного лучше - гораздо проще использовать сайт, сменить пароль, изменить свою фотографию и тому подобное», - сказал он.

Мистер Большой шаг Бененсона был основан на запущенном на Kickstar проекте под названием Emoji Dick, где он использовал Mechanical Turk для перевода начала Моби Дика в - как вы уже догадались - смайлики. Ему пришло в голову, что этот процесс можно аккуратно применить для получения «обучающих данных» для системы, позволяющей классифицировать множество кампаний сайта.

Г-н. Медри сказал, что однажды ему дали выходные, чтобы выяснить пожизненную ценность клиентов Etsy - то, что компания, по-видимому, ранее не рассчитывала и что потенциальный инвестор хотел увидеть, прежде чем брать на себя обязательства. (Они получили деньги.)

DataGotham работает до конца дня; здесь вы можете посмотреть прямую трансляцию.

комментариев

Добавить комментарий