Sådan opbygges en fantastisk datavidenskabsportefølje

Hvis afsnittet om færdigheder i dit CV indeholder Python, R, SQL, Machine Learning, Deep Learning, og du spekulerer på, hvorfor du bliver afvist hver gang, skal du fortsætte med at læse.

Der er millioner af mennesker, der søger et job inden for datalogi, og mulighederne er begrænsede. Så det vigtige spørgsmål er, hvordan kan du stå adskilt fra pakken?

Guiden forsøger at fange alt hvad du behøver for at opbygge en kickass-portefølje - så god, at de ikke kan ignorere dig!

Hvorfor skal du oprette en portefølje?

For en person, der har modtaget en kandidatgrad eller en ph.d. fra et kollegium i topklasse er det måske ikke så svært at få et job. Instituttet tilføjer troværdighed til din profil, som arbejdsgiverne ser efter.

For en person, der ikke har en relevant grad eller nok erfaring, skal denne troværdighed etableres via en stjerneportefølje, der viser dit potentiale. Porteføljen fungerer derefter som bevis på dine kompetencer.

Der er mange faktorer, der kan forbedre dine chancer for at blive bemærket af en arbejdsgiver. Med en smart strategi og konsekvent indsats vil du være i stand til at knække den.

Lad os opbygge en narre-bevis plan lige her for at arbejde hen imod landing af et job!

Trin 1 - Identificer dig selv

At hoppe fra en karriereportal til en anden og ansøge om ethvert job, der nævner "Data", er ikke et smart skridt. Det ville øge din stress og arbejdsbyrde kun for at lære, at de har afvist dig.

Begræns din søgning

Billede til post

Datavidenskabsspektret i sig selv er enormt. De fleste mennesker ligger i en af ​​pyramidens lag vist i diagrammet. Kun få kan mestre to eller tre af lagene.

En datadrevet organisation i dag beskæftiger sig med forskellige stillinger, og her er en liste med sværhedsgraden af ​​de problemer, som disse fagfolk løser:

  • Dataanalytikere - Let til medium
  • Dataingeniører - Medium til hård
  • ML Ingeniører - Medium
  • Forskning / dataforskere - hårdt
  • AI-ingeniører / dyb læringsudøvere - meget hårdt

Det er klart, at ingen kan trække alle opgaverne ud. Den første ting, du skal gøre, er at identificere de færdigheder, du har mestret (eller vil mestre). Baseret på denne færdighedssæt skal du kortlægge den jobbeskrivelse, du vil sigte efter.

Trin 2 - Studere jobbeskrivelsen

Hvis du bruger nok tid på at gennemgå en masse jobbeskrivelser af forskellige dataprofiler, vil du bemærke, at de beder om oplevelsen, selvom det er til nogen, der er frisk ud af et college.

Den anden ting, du skal forstå, er at der er job, der har mere generalistiske krav som dataanalyse. Og så er der mere fokuserede og dedikerede forskningsområder som en forsker i en hedgefond, som er meget matematisk tung.

Her er et par skærmbilleder, som jeg har taget fra et par store (Facebook, NetFlix) og mid-siz e (h20.ai) organisationer ser efter i en kandidat:

Billede til post

At studere dem fører os tilbage til det meget vigtige og ofte stillede spørgsmål:

Hvordan kompenserer jeg for oplevelsesfaktoren, hvis jeg er frisk ude af skolen ?

Svaret er projekter!

Vente! Jeg vidste allerede, at ...

Her er hvad du sandsynligvis ikke vidste - disse projekter kan ikke være din analyse over MNIST-datasæt eller løse Titanic-datasættets klassifikationsproblem.

Så hvilken slags projekter? Hvor får jeg disse projekter? Hvad skal jeg gøre?

For at svare på det, lad os dykke ned i opbygningen af ​​din portefølje.

Trin 3 - Viser ekspertise via projekter

Projekter er din eneste erstatning for oplevelse.

Da Chris Albon blev spurgt om, hvad folk skulle have i deres portefølje, når de søger deres første job i et interview med Datacamp, sagde:

... når nogen ansøger, er nogle af de bedste ting, de kan ansøge om, projekter, de har lavet eller noget som f.eks. en boot camp eller måske deres afhandling eller lignende, hvor vi kan se og sig, åh, sejt, ligesom du har lavet nogle interessante ting, har du arbejdet med nogle data, nogle interessante måder.

Hvad skal disse projekter afspejle:

Der er fire vigtige faktorer, som dine projekter skal validere, uanset hvilken profil du ansøger om:

  1. Dit faste greb om krævede kompetencer
  2. Den kompleksitet af det problem, du har løst eller studeret - det kan enten være en roman problem eller en almindeligt stillede enterprise-grade problem.
  3. Domæneekspertise - mængden af ​​forskning, du har foretaget for at finde svarene på spørgsmålene eller bygningsdatainfrastrukturen.
  4. Din vilje til at gå den ekstra mil og få projektet til at skille sig ud - Implementere dit projekt til offentlig brug eller skrive en blog eller offentliggøre en video for at forklare dine resultater.

Typer af projekter, der skal tilføjes til din portefølje

Under hensyntagen til de ovennævnte faktorer, her er en liste over projektideer, der kræver oprigtig indsats, men som lægger vægt på din portefølje.

  • Arbejde med ægte data: Hvis du kan vise nogen, at du kan arbejde med rådata fra forskellige kilder og besvare interessante spørgsmål om sociale love, økonomi, sundhedspleje eller ethvert videnskabeligt eksperiment, ville det blive højt anset.
  • Udforskning p ublicly tilgængelige datasæt:
Billede til post

Brug af offentligt tilgængelige datasæt, udforske dataene til flere indsigter, definere spørgsmål, der aldrig er blevet stillet før, grave i tidsskrifter og forskningsopgaver for at lede efter relateret materiale og derefter afdække skjulte mønstre ved hjælp af statistiske modeller.

En grundig analyse af et offentligt tilgængeligt datasæt er igen et godt sted at starte.

  • Udnyt din nysgerrighed: Som en nysgerrig dataprofessional skal der være produkter / tjenester / spørgsmål, som du finder spændende. Brug denne nysgerrighed til at grave i nye problemer. For eksempel kan en sportsfanatiker gå omkring med at opbygge et dashboard eller en datainfrastruktur, der styrer statistikken og præstationsmønstrene for alle spillerne.
  • Bidrag til open source- pakker : Enhver organisation holder open source-bidrag til maskinindlæring eller videnskabelige computerpakker med høj respekt. Udvikling til gratis og open-source software forbedrer i høj grad dine chancer for at blive rekrutteret. Du kan prøve at bidrage til pakker som sklearn, numpy og pandaer. Det viser, at du kan arbejde med store og komplekse kodebaser, og at du kender dine ting godt.
  • Opbygning af ende-til-ende-projekter: En god måde at bevise, at du virkelig er generalist, er at bygge ende-til-ende projekter (mere som produkter). Stop ikke med at finde løsningen eller oprette en prototype til et anbefalingssystem eller en fintech chatbot. Gå en ekstra mil, implementer den, del den med dine jævnaldrende for at bruge den, indsaml nogle analyser. Dette viser, hvor lidenskabelig du er om, hvad du gør, og i hvilket omfang du kan gå for at lære nye teknologier og metoder.
  • Færdighedsspecifikke projekter: Der er mennesker, der er rigtig gode til at rense data eller skabe indsigtsfulde plot eller automatisere datarørledninger. Du bør overveje at udvikle dine egne Python-pakker, der kan automatisere disse rengøringsopgaver eller givet en dataramme, at pakken skal oprette par-plots og alle andre muligheder for at fremskynde EDA-processen.

Liste over nogle virkelig seje porteføljer til inspiration:

  • //nycdatascience.com/blog/student-works/improving-a-music-websites-user-experience/
  • //varianceexplained.org/r/trump-tweets/
  • //nycdatascience.com/blog/student-works/forecasting-cryptocurrency-price-trends/
  • //nycdatascience.com/blog/student-works/web-scraping/covid19s-impact-on-preventable-cancer-risk-in-women-a-call-for-action/

Tidslinje for projektet

Den tid, du bruger på et projekt, giver fingerpeg om kompleksiteten, niche og den mængde arbejde, det kræver. Det skal hjælpe dig med at retfærdiggøre, om projektet er porteføljeværdig eller ej.

Hvor meget du lægger på dit projekt for at tage det til næste niveau afhænger af mange forskellige faktorer.

Bare for at give dig noget at kvantificere, hvis du har hentet en spirende teknologi til at arbejde med, skal du bruge mindst en måned på at bygge noget konkret.

Sådan tilføjes disse projekter til din portefølje

Når du har et par gode projekter, som du kan medtage i din portefølje, er det næste trin at pakke dit arbejde på den bedst mulige måde.

Apple er kendt for sin emballage og design. Vær oprigtig med, hvordan du pakker dit arbejde, inden du viser det.

Sådan kan du tilføje mere vægt til dine projekter:

  • GitHub URL: Hvis du beslutter at tilføje et link til din repo, så sørg for at repo bare ikke indeholder en Jupyter notesbog, bør den have alle de andre filer somrequirements.txt,.gitignoreen licens, hvis det kræves, og så videre. På den måde bliver du ansat som en komplet pakke og ikke kun som en Jupyter-notesbogekspert.
  • Blogs: At skrive om, hvad du har opnået, er altid en god praksis, og for arbejdsgivere bygger det tilliden til dit arbejde og din evne til effektivt at kommunikere det, du har gjort.
  • Implementerede applikationer: Hvis du har implementeret din ML-drevne applikation, skal du give linket, som arbejdsgiveren kan lege med det.
  • Dashboards: Hvis du er stolt af din analyse, kan du gå på at oprette et dashboard ud af det. Du kan bruge Voila eller Dash, hvis du arbejder i Python. Hvis du er en forretningsanalyseekspert, kan du tilføje din Power BI eller Tableauinstrumentbræt tilfremvis dine analytiske færdigheder.

Trin 4 - Profiler på sociale medier

En god profil på sociale medier kan hjælpe dig med at få dit næste drømmejob. GitHub, LinkedIn, Twitter, Kaggle, StackOverflow og Medium er de vigtigste platforme, som folk bruger til at dele deres arbejde / følelser, netværk, forbruge information og annoncere.

Organisationer og rekrutterere bruger disse platforme til at nå ud til deres næste potentielle ansættelse.

  • GitHub: At have en god GitHub-profil med mange bidrag eller stjerner på dine arkiver gør dig til en konkurrencedygtig programmør.
Billede til post
  • Kaggle: Deltagelse i Kaggle-konkurrencer, oprettelse af nyttige notesbøger og datasæt kan også hjælpe dig med at opbygge en god dataanalytikerprofil.
Billede til post

Et uddrag fra Reshama Shaikhs post To Kaggle or Not siger:

Det er sandt, at gøre en Kaggle-konkurrence ikke kvalificerer nogen til at være dataforsker. Det tager heller ikke en klasse eller deltager i en konferencetutorial eller analyserer et datasæt eller læser en bog i datalogi. Arbejde med konkurrence (r) føjer til din oplevelse og udvider din portefølje. Det er et supplement til dine andre projekter, ikke den eneste lakmustest af ens datavidenskabssæt.
  • LinkedIn: Jeg har personligt brugt LinkedIn til at lande mit første job, min første klient og mange samarbejdspartnere. Det er en one-stop platform til at få kontakt med mennesker, der arbejder hos dine drømmefirmaer, interagere med dem, finde job og følge interessante fremskridt. Læs denne komplette datavidenskab LinkedIn profilguide for at optimere din profil.

    Tip: Du skal være klar til at tilbyde noget først, før du beder om en tjeneste.

  • Twitter: Alle de store navne i datavidenskabsrummet bruger Twitter ganske ofte, og du kommer til at interagere med mennesker i dit felt. Du lærer om, hvad disse mennesker arbejder på, og deres synspunkter om sociale spørgsmål.

    Du kan promovere dine blogs, videoer og andre fund med din Twitter. Folk har jobtilbud, invitationer til konferencer, freelancearbejde og influencer marketingkontrakter for deres arbejde og god tilhængerskab på Twitter.

Top data forskere at følge på Twitter:

  • Andreas Mueller - Sci-kit Lær udvikler
  • Yann LeCunn - Chief AI Scientist hos Facebook
  • Dean Abbott - Chief Data Scientist SmarterHQ
  • Andrew Ng - medstifter af Coursera

Der er mange andre, du kan se på min profil og de mennesker, jeg følger på min Twitter-profil.

Trin 5 - Kondensering af en portefølje til et enkelt CV-CV

Det vigtigste element i din jobansøgning er dit CV, da det beslutter, om du vil blive opført på listen eller ikke.

I betragtning af at du har alle andre elementer i god form, er det tid til at kondensere disse oplysninger i et elegant og koncist CV.

Som du skal vide, bruger rekruttererne ikke mere end et par minutter på at skimme gennem dit CV, så du skal formidle alt, hvad du har gjort på en enkelt side.

De vigtigste afsnit efter dit navn og kontaktoplysninger:

  1. Resumé : Formidl i 1-2 sætninger, hvad du har lavet, og hvad du har til hensigt at gøre.
  2. Færdigheder : Udfyld ikke disse med alle de tilfældige færdigheder, der kommer til at tænke på. Marker dig ikke på en skala. En enkelt linje med alle de vigtigste kompetencer skulle være nok.
  3. Projekter : Dette bør være det største afsnit for nye grader, da du ikke har meget i din oplevelsesafdeling. Vær kortfattet om, hvad du har opnået, tilføj hyperlinks til dit arbejde. Indhent capstone-projekter, Kaggle-konkurrencer, uafhængig forskning og projekter. Dette afsnit kaldes din portefølje.
  4. Kursus : Tilføj kun relevant kursus. Du kan nævne din GPA, hvis det er relevant.
  5. Erfaring (hvis du har nogen): Tilføj relevant jobhistorik sammen med de punkter, der taler om de vigtigste opgaver, du har udført i organisationen.
  6. Sociale medielinks : Glem ikke at tilføje links til dine aktive sociale medieprofiler.

Her er et eksempel på et godt CV, der blev gennemgået under Kaggle CareerCon2018:

Billede til post

Opfordring til handling

Du har sandsynligvis stadig mange spørgsmål. Hvor skal du kigge efter projektideer? Hvordan kommer du i gang? Hvordan forbereder du jer på interviews? Og mange flere.

Jeg har arbejdet med at oprette projekter til hver profil baseret på min erfaring med at arbejde som instruktionsdesigner til web- og datavidenskabsspor.

Baseret på dit svar på dette indlæg opretter jeg en Discord-kanal til hver profil, hvor jeg deler projekterne og instruktionerne til at udfylde dem med den tidslinje, der er knyttet til hver enkelt.

Jeg tror stærkt på projektbaseret pædagogik og dermed vil jeg skabe meget indhold, hvor projektudvikling vil blive dækket. Jeg vil dele de ressourcer, du kan bruge til at lære (hvoraf nogle opretter jeg selv) og gennemføre projekterne med succes.

Du kan se på et af mine eksempler her: COVID-19 Interactive Analysis Dashboard fra Jupyter Notebooks.

Her er videoversionen af ​​dette blogindlæg på min kanal Data Science med Harshit:

Datavidenskab med Harshit

Med denne kanal planlægger jeg at udrulle et par serier, der dækker hele datavidenskabsrummet. Her er hvorfor du skal abonnere på kanalen:

  • Disse serier dækker alle de krævede / krævede kvalitetsvejledninger om hvert af emnerne og underemnerne som Python-grundlæggende data.
  • Forklaret matematik og afledninger af, hvorfor vi gør, hvad vi gør i ML og Deep Learning.
  • Podcasts med dataforskere og ingeniører hos Google, Microsoft, Amazon osv. Og administrerende direktører for store datadrevne virksomheder.
  • Projekter og instruktioner til implementering af de emner, der er lært indtil videre.

For at tage diskussionen videre, er du velkommen til at oprette forbindelse til mig på LinkedIn eller Twitter.