Как получить свою первую работу в Data Science?

Как можно получить ее работу первого уровня в качестве ученого или аналитика данных? Если вы прокрутите форумы по науке о данных, вы найдете много вопросов по этой теме. Читатели моего блога по науке о данных (data36.com) время от времени спрашивают меня об одном и том же. И я могу сказать вам, что это абсолютно актуальная проблема!

Я решил обобщить свои ответы на все основные вопросы!

NEW! Я создал всеобъемлющий (бесплатный) онлайн-видео курс, чтобы помочь вам начать работу с Data Science. Нажмите здесь для получения дополнительной информации: Как стать Data Scientist.

РЕГИСТРАЦИЯ ЗДЕСЬ (БЕСПЛАТНО): https://data36.com/how-to-become-a-data-scientist/

# 1: Каковы наиболее важные навыки и инструменты исследователя данных? И как вы можете их получить?

Хорошие новости - плохие новости.

Я начну с плохого. В 90% случаев навыки, которым они обучают вас в университетах, не очень полезны в реальных научных проектах в области данных. Как я уже писал несколько раз, в реальных проектах необходимы 4 навыка кодирования данных:

  • bash / командная строка
  • питон
  • SQL
  • р
  • (а иногда и Java)
Источник: KDnuggets

Какие 2 или 3 вы найдете наиболее полезными, зависит от компании ... Но если вы выучили одну, вам будет гораздо легче выучить другую.

Итак, первый большой вопрос: как вы можете получить эти инструменты? Вот и хорошие новости! Все эти инструменты бесплатны! Это означает, что вы можете скачать, установить и использовать их, не платя за них ни копейки. Вы можете попрактиковаться, создать проект для хобби данных или что-нибудь еще!

Недавно я написал пошаговую статью о том, как установить эти инструменты на ваш компьютер. Проверьте это здесь.

# 2: Как учиться?

Существует два основных способа легко и экономически эффективно изучить науку о данных.

1-й: Книги.

Вроде старая школа, но все равно хороший способ обучения. Из книг вы можете получить очень целенаправленные, очень подробные знания об онлайн-анализе данных, статистике, кодировании данных и т. Д. Я выделил 7 книг, которые рекомендую в предыдущей статье, здесь.

Лучшие 7 книг данных, которые я рекомендую

2-е: онлайн вебинары и видео курсы.

Онлайн-курсы по науке о данных предлагаются по справедливой цене (от 10 до 500 долларов США) и охватывают различные темы - от кодирования данных до бизнес-аналитики. Если вы не хотите тратить деньги на это в начале, я перечислил бесплатные курсы и учебные материалы в этом посте.

(3-й: курс «Первый месяц» для Junior Data Scientist). Я создал 6-недельный онлайн-курс по науке о данных, призванный научить специалистов по обработке данных практиковаться и решать реальные задачи на основе набора данных: первый месяц Junior Data Scientist. .)

# 3: Как практиковать и как получить реальный жизненный опыт

Это хитрый, верно? Каждая компания хочет, чтобы люди имели хотя бы небольшой опыт работы в реальной жизни… Но как вы получаете опыт из реальной жизни, если вам нужен реальный жизненный опыт, чтобы получить свою первую работу? Классический улов-22. И ответ: любимые проекты.

«Pet project» означает, что вы пришли к идее проекта данных, которая вас взволновала. Тогда вы просто начинаете его строить. Вы можете думать об этом как о небольшом стартапе, но убедитесь, что вы продолжаете сосредотачиваться на части проекта, связанной с наукой о данных, и можете просто игнорировать деловую часть. Чтобы дать вам некоторые идеи, вот некоторые из моих любимых проектов за последние несколько лет:

  • Я создал скрипт, который отслеживал веб-сайт по недвижимости и отправлял мне лучшие предложения в режиме реального времени, чтобы я мог получить эти предложения раньше всех.
  • Я создал сценарий, который собирал все статьи из ABC, BBC и CNN и, основываясь на используемых словах, соединил статьи на одну и ту же тему на трех разных новостных порталах.
  • Я создал чат самообучения в Python. (Это не слишком умно, хотя - я еще не тренировался.)

Будь креативным! Найдите для себя проект, связанный с наукой о животных, и начните писать код! Если вы столкнулись с проблемой кодирования - это может легко произойти, когда вы начнете изучать новый язык данных - просто используйте Google и / или stackoverflow. Один мой короткий пример - о том, насколько эффективен стекопоток:

левая сторона: мой вопрос - правая сторона: ответ (через 7 минут)

Обратите внимание на отметку времени! Я послал какой-то сложный вопрос, и я получил ответ через 7 минут. Единственное, что мне нужно было сделать, это скопировать код в мой рабочий код и бум, это просто сработало!

(Примечание: Cross Validated - еще один замечательный форум для вопросов, связанных с наукой о данных.)

+1 предложение:

Даже если это немного сложно, попробуйте найти наставника. Если вам повезет, вы найдете кого-то, кто работает в Data Scientist в хорошей компании и может проводить с вами 1 час в неделю или раз в две недели, обсуждать или преподавать.

# 4: Куда и как вы отправляете свою первую заявку на работу?

Если вам не удалось найти наставника, вы все равно можете найти своего первого в своей первой компании. Это будет ваша первая работа, связанная с наукой о данных, поэтому я предлагаю не сосредотачиваться на больших деньгах или на супер-модной атмосфере стартапа. Сосредоточьтесь на поиске среды, в которой вы можете учиться и совершенствовать себя.

Начало вашей первой работы в области данных в многонациональной компании может не совпадать с этой идеей, потому что люди там обычно слишком заняты своими делами, поэтому у них не будет времени и / или мотивации, чтобы помочь вам улучшить (конечно, всегда есть исключения).

Начинать с крошечного стартапа в качестве первого сотрудника по управлению данными в вашем случае тоже не очень хорошая идея, потому что у этих компаний нет старших специалистов по данным.

Я советую вам сосредоточиться на 50–500 компаний. Это золотая середина. На борту находятся старшие специалисты по данным, но они не слишком заняты, чтобы помочь и научить вас.

Хорошо, вы нашли несколько хороших компаний ... Как подать заявку? Некоторые принципы для вашего резюме: выделите ваши навыки и проекты, а не ваш опыт (так как у вас еще не так много лет на бумаге). Перечислите соответствующие языки кодирования (SQL и Python), которые вы используете, и свяжите некоторые из ваших связанных репозиториев github, чтобы вы могли показать, что вы действительно использовали этот язык.

Кроме того, в большинстве случаев компании запрашивают сопроводительное письмо. Конечно, это хорошая возможность выразить свой энтузиазм, но вы также можете добавить некоторые практические детали, например, что бы вы делали в первые несколько недель, если бы вас приняли на работу. (Например, «глядя на ваш процесс регистрации, я думаю, что ____ веб-страница играет важную роль. В первые несколько недель я выполняю ___, ___ и ___ (специальные анализы), чтобы подтвердить эту гипотезу и понять ее более глубоко». Это может помочь компании улучшить _____ и в конечном итоге увеличить _____ KPI ».)

Надеюсь, это даст вам собеседование, где вы сможете немного поболтать о ваших любимых проектах, предложениях по сопроводительному письму, но в основном это будет проверка личности и, скорее всего, некоторый базовый тест навыков. Если вы достаточно много тренировались, вы это пройдете ... но если вы нервный тип и хотите больше практиковаться, вы можете сделать это на hackerrank.com.

Заключение

Ну вот и все. Я знаю, что это звучит легче, когда оно написано, но если вы действительно решили стать специалистом по данным, это не составит труда сделать это! Удачи с этим!

Если вы хотите испытать, каково это - быть младшим ученым-данными в стартапе, ознакомьтесь с моим 6-недельным онлайн-курсом по науке о данных: «Первый месяц младшего специалиста по данным»!

А если вы хотите узнать больше о науке о данных, посетите мой блог (data36.com) и / или подпишитесь на мою рассылку! И не пропустите мою новую серию учебников по кодированию: SQL для анализа данных!

Спасибо за прочтение!

Понравилась статья? Пожалуйста, просто дайте мне знать, нажав ниже. Это также помогает другим людям увидеть историю!

Томи Местер, автор data36.com Twitter: @ data36_com