Jak zdobyć pierwszą pracę w Data Science?

Jak zdobyć pierwszą pracę na stanowisku naukowca lub analityka danych? Przeglądając fora danych, znajdziesz wiele pytań na ten temat. Czytelnicy mojego bloga poświęconego analizie danych (data36.com) pytają mnie od czasu do czasu. I mogę powiedzieć, że jest to całkowicie ważny problem!

Postanowiłem streścić moje odpowiedzi na wszystkie najważniejsze pytania!

NOWY! Stworzyłem kompleksowy (bezpłatny) kurs wideo online, który pomoże Ci rozpocząć pracę z Data Science. Kliknij tutaj, aby uzyskać więcej informacji: Jak zostać naukowcem danych.

ZAREJESTRUJ SIĘ TUTAJ (ZA DARMO): https://data36.com/how-to-become-a-data-scientist/

# 1: Jakie są najważniejsze umiejętności i narzędzia naukowców? Jak je zdobyć?

Dobra wiadomość - zła wiadomość.

Zacznę od złego. W 90% przypadków umiejętności, których uczą na uniwersytetach, nie są tak naprawdę przydatne w prawdziwych projektach z zakresu nauki o danych. Jak już kilkakrotnie pisałem, w prawdziwych projektach potrzebne są 4 umiejętności kodowania danych:

  • bash / linia poleceń
  • Pyton
  • SQL
  • R
  • (a czasem Java)
źródło: KDnuggets

Które 2 lub 3 najbardziej Ci się przydadzą, tak naprawdę zależy od firmy… Ale jeśli się tego nauczyłeś, łatwiej będzie nauczyć się innego.

Pierwsze duże pytanie brzmi: jak zdobyć te narzędzia? Oto dobra wiadomość! Wszystkie te narzędzia są bezpłatne! Oznacza to, że możesz je pobrać, zainstalować i używać bez płacenia za nie ani grosza. Możesz ćwiczyć, budować projekt hobby danych lub cokolwiek innego!

Niedawno napisałem artykuł krok po kroku na temat instalowania tych narzędzi na komputerze. Sprawdź to tutaj.

# 2: Jak się uczyć?

Istnieją dwa główne sposoby łatwego i efektywnego uczenia się nauk o danych.

1st: książki.

Trochę oldschoolowy, ale wciąż dobry sposób na naukę. Z książek można uzyskać bardzo skoncentrowaną, bardzo szczegółową wiedzę na temat analizy danych online, statystyk, kodowania danych itp.… W tym artykule wyróżniłem 7 książek, które polecam w poprzednim artykule.

Top 7 książek danych, które polecam

2: seminaria internetowe i kursy wideo.

Kursy online z zakresu analizy danych mają uczciwe ceny (10–500 USD) i obejmują różne tematy, od kodowania danych po inteligencję biznesową. Jeśli nie chcesz wydawać na to pieniędzy na początku, w tym poście zamieściłem bezpłatne kursy i materiały edukacyjne.

(Trzeci: kurs dla pierwszego specjalisty ds. Danych w pierwszym miesiącu Stworzyłem 6-tygodniowy kurs online dla naukowców zajmujących się danymi, aby ćwiczyć i rozwiązywać rzeczywiste zadania w oparciu o prawdziwy zbiór danych: pierwszy miesiąc dla młodszych naukowców .)

# 3: Jak ćwiczyć i jak zdobyć prawdziwe doświadczenie życiowe

To trudne, prawda? Każda firma chce mieć ludzi z przynajmniej odrobiną prawdziwego doświadczenia… Ale jak zdobyć prawdziwe doświadczenie, jeśli potrzebujesz prawdziwego doświadczenia, aby zdobyć pierwszą pracę? Classic catch-22. Odpowiedź brzmi: projekty zwierząt domowych.

„Projekt zwierzaka” oznacza, że ​​wpadłeś na pomysł projektu danych, który cię ekscytuje. Następnie po prostu zacznij go budować. Możesz myśleć o tym jak o małym startupie, ale upewnij się, że skupiasz się na części projektu poświęconej analizie danych i możesz po prostu zignorować część biznesową. Aby dać ci kilka pomysłów, oto niektóre z moich domowych projektów z ostatnich kilku lat:

  • Zbudowałem skrypt, który monitorował witrynę internetową poświęconą nieruchomościom i wysyłał mi najlepsze oferty w czasie rzeczywistym - aby móc uzyskać te oferty przed wszystkimi innymi.
  • Zbudowałem skrypt, który pobierał wszystkie artykuły z ABC, BBC i CNN, i na podstawie użytych słów połączyłem artykuły na ten sam temat na 3 różnych portalach z wiadomościami.
  • Zbudowałem samouczącego się chatbota w Pythonie. (Nie jest to jednak zbyt mądre - ponieważ jeszcze go nie trenowałem.)

Bądź kreatywny! Znajdź projekt zwierzaka związany z nauką danych i zacznij kodować! Jeśli natrafisz na problem z kodowaniem - może się to łatwo zdarzyć, kiedy zaczniesz uczyć się nowego języka danych - po prostu skorzystaj z google i / lub stackoverflow. Jeden krótki przykład mojego - na temat tego, jak skuteczny jest przepływ stosu:

lewa strona: moje pytanie - prawa strona: odpowiedź (za 7 minut)

Zwróć uwagę na znacznik czasu! Wysłałem coś w rodzaju skomplikowanego pytania i otrzymałem odpowiedź w ciągu 7 minut. Jedyne, co musiałem zrobić, to skopiować i wkleić kod do mojego kodu produkcyjnego i boom, to po prostu działało!

(Uwaga: Cross Validated to kolejne świetne forum do pytań związanych z Data Science).

Sugestia +1:

Nawet jeśli jest to trochę trudne, postaraj się o mentora. Jeśli masz szczęście, znajdziesz kogoś, kto pracuje w roli Data Scientist w miłej firmie i który może spędzić z Tobą 1 godzinę tygodniowo lub co dwa tygodnie i dyskutować lub uczyć różnych rzeczy.

# 4: Gdzie i jak wysyłasz swoje pierwsze podanie o pracę?

Jeśli nie udało ci się znaleźć mentora, nadal możesz znaleźć swojego pierwszego w swojej pierwszej firmie. To będzie twoja pierwsza praca związana z nauką danych, więc sugeruję, aby nie skupiać się na dużych pieniądzach lub na bardzo fantazyjnej atmosferze startupów. Skoncentruj się na znalezieniu środowiska, w którym możesz się uczyć i ulepszać.

Podjęcie pierwszej pracy w dziedzinie danych w międzynarodowej firmie może nie być zgodne z tym pomysłem, ponieważ ludzie tam zwykle są zbyt zajęci swoimi rzeczami, więc nie będą mieli czasu i / lub motywacji, aby pomóc Ci poprawić (oczywiście, zawsze są wyjątki).

Rozpoczynanie od małego startupu jako pierwsza osoba do spraw danych w zespole nie jest dobrym pomysłem w twoim przypadku, ponieważ te firmy nie mają starszych specjalistów od danych, z których mogliby się uczyć.

Radzę skupić się na firmach o wielkości 50–500. To złoty środek. Starsi naukowcy zajmujący się danymi są na pokładzie, ale nie są zbyt zajęci, aby ci pomóc i uczyć.

Ok, znalazłeś kilka dobrych firm… Jak złożyć wniosek? Niektóre zasady dotyczące CV: podkreśl swoje umiejętności i projekty, a nie doświadczenie (ponieważ nie masz jeszcze zbyt wielu lat, aby napisać na papierze). Wymień odpowiednie języki kodowania (SQL i Python), których używasz, i połącz kilka powiązanych repozytoriów github, abyś mógł pokazać, że naprawdę używałeś tego języka.

Ponadto w większości przypadków firmy proszą o list motywacyjny. To oczywiście dobra okazja do wyrażenia entuzjazmu, ale możesz również dodać kilka praktycznych szczegółów, takich jak to, co zrobiłbyś w pierwszych tygodniach, gdybyś został zatrudniony. (Np. „Patrząc na przebieg rejestracji, domyślam się, że strona ____ odgrywa ważną rolę. W ciągu pierwszych kilku tygodni przeprowadzałam ___, ___ i ___ (szczegółowe analizy), aby udowodnić tę hipotezę i lepiej ją zrozumieć. Mogłoby to pomóc firmie poprawić _____ i ostatecznie podnieść _____ KPI. ”)

Mamy nadzieję, że dzięki temu uzyskasz rozmowę kwalifikacyjną, na której możesz porozmawiać o swoich domowych projektach, sugestiach dotyczących listu motywacyjnego, ale będzie to głównie sprawdzanie osobowości i prawdopodobnie podstawowy test umiejętności. Jeśli ćwiczysz wystarczająco dużo, zdasz to… ale jeśli jesteś nerwowy i chcesz więcej ćwiczyć, możesz to zrobić na hackerrank.com.

Wniosek

Cóż, to wszystko. Wiem, że brzmi to łatwiej, gdy jest napisane, ale jeśli naprawdę jesteś zdeterminowany, aby zostać Data Scientist, nie będzie problemu, aby to się stało! Powodzenia z tym!

Jeśli chcesz wypróbować, jak to jest być młodszym naukowcem danych w prawdziwym startupie, sprawdź mój 6-tygodniowy internetowy kurs danych: pierwszy miesiąc młodszego naukowca!

A jeśli chcesz dowiedzieć się więcej o analizie danych, sprawdź mój blog (data36.com) i / lub subskrybuj mój biuletyn! I nie przegap mojej nowej serii samouczków programowania: SQL do analizy danych!

Dziękuje za przeczytanie!

Podobał Ci się artykuł? Daj mi znać, klikając poniżej. Pomaga także innym osobom zobaczyć historię!

Tomi Mester autor data36.com Twitter: @ data36_com