Anmeldelse: Udacity Data Analyst Nanodegree Program

Udacitys Data Analyst Nanodegree-program var et af de første online datavidenskabsprogrammer i onlineuddannelsesrevolutionen. Det sigter mod at "sikre, at du mestrer de nøjagtige færdigheder, der er nødvendige for at opbygge en karriere inden for datalogi." Opfylder det sit mål? Er det den bedste mulighed?

Jeg afsluttede programmet i efteråret 2016. Brug inspiration fra Class Centrals open source review-skabelon, her er min anmeldelse af Udacitys Data Analyst Nanodegree-program.

OPDATERING: Data Analyst Nanodegree-programmet blev opdateret med nyt indhold og studenterydelser i september 2017. Detaljer her. Jeg blev også bragt om bord for at hjælpe med at genskabe noget af dette nye indhold. Størstedelen af ​​denne gennemgang er uændret. Faktiske opdateringer er angivet med kursiv skrifttype.

Baggrundsinformation

Hvad fik mig til at beslutte at tage dette program?

I begyndelsen af ​​2016 begyndte jeg at oprette mit eget datalogi-masterprogram ved hjælp af online ressourcer. (Du kan læse om det her.) Jeg tilmeldte mig Data Analyst Nanodegree-programmet af nogle få grunde:

  • Jeg ville have en guide til min introduktion til datalogi.
  • Jeg ønskede et sammenhængende program i stedet for individuelle kurser fra en række udbydere.
  • Det fik fantastiske anmeldelser.
  • Jeg havde taget et par Udacity-kurser før, og jeg var fan af deres undervisningsstil.

Hvad var mine mål?

Selvom programmet kan fungere som en bro til et job (mere om det senere), ville jeg bruge programmet som en introduktion til mere avanceret materiale. Dette “mere avancerede materiale” gælder både for emner, der er omfattet af programmet, og emner, der ikke er det.

Hvad er et Udacity Nanodegree-program?

Udacity er en af ​​de førende onlineuddannelsesudbydere. Sebastian Thrun, tidligere Stanford-professor og Google X-grundlægger, grundlagde virksomheden og fokuserer på innovation hos Udacity som præsident og formand. Vish Makhijani er administrerende direktør.

Nanodegree-programmer er onlineoplysninger leveret af Udacity. De er samlinger af Udacity-kurser (nogle er gratis, andre ikke), der har tilknyttet projekter, som gennemgås af Udacitys betalte projektanmeldere. De kommer også med en masse studenterydelser.

Slack bruges som et fællesskabsværktøj, hvor Udacity-studerende kan interagere med andre studerende såvel som deres programs instruktører og andet Udacity-personale. I de fleste programmer har studerende tildelt mentorer og kommunikerer med dem via en privat chatkanal, der altid er tilgængelig i Udacity-klasseværelset.

Data Analyst Nanodegree-programmet blev oprindeligt udgivet i 2014. Det var Udacitys andet Nanodegree-program. Selvom det har gennemgået nogle ændringer gennem årene, er kernen i programmet intakt.

Hvem er instruktørerne, og hvad er deres baggrund?

Fordi Data Analyst Nanodegree-programmet er en samling af Udacity-kurser (igen nogle gratis, andre ikke), er der flere instruktører. Deres genoptagelser inkluderer ofte prestigefyldte roller i store teknologivirksomheder og grader fra topskoler i USA.

De er ikke i sig selv "instruktører", men Udacitys projektanmeldere, mentorer og studenterfaringsmedarbejdere (som overvåger Slack sammen med instruktører) er blandt de mennesker, du interagerer mest med. De er så, så hjælpsomme. Mere om det senere.

Koste

Programmet er opdelt i to termer. Den første periode koster $ 499 USD. Den anden periode koster $ 699 USD. Hvis du har en stærk forståelse af de færdigheder, der undervises i den første periode, kan du springe den over, kun gennemføre den anden periode og stadig opnå legitimationen.

Anbefalede forudsætninger

Til semester 1 anbefaler Udacity, at studerende er fortrolige med beskrivende statistikker og har en vis erfaring med at arbejde med data i regneark eller SQL.

I semester 2 skal de studerende have erfaring med at analysere data ved hjælp af Python samt en solid forståelse af inferentiel statistik og dens applikationer.

Min baggrund / mine færdigheder i programmet

Jeg startede programmet i maj 2016, da jeg havde et par måneders programmeringserfaring, hovedsagelig inden for C og Python. Langt størstedelen af ​​denne erfaring var fra bromodulet til mit datalogi-kandidatuddannelse, hvor jeg tog Harvards CS50: Introduktion til datalogi og Udacitys introduktion til programmering af nanodegree-programmet.

Jeg var også færdig med min kandidatuddannelse inden for kemiteknik og havde 24 måneders kvantrelateret joberfaring. Dette betød, at jeg havde taget flere statistikkurser og var fortrolig med data.

Programmet

Struktur

Data Analyst Nanodegree-programmet er opdelt i to termer. Hver periode har tre kurser og fire projekter (det ekstra projekt er et introprojekt, der hjælper dig med at vænne dig til Udacity-læringsmiljøet). Mat Leonard, programmets studieordning på tidspunktet for opdateringen, er til stede i hele programmet, da han introducerer hvert kursus, dets formål i programmet og dets instruktør (er).

Kursusindhold består af en kombination af videoer, tekst og quizzer. Videoer har en tendens til at variere fra 30 sekunder til fem minutter i henhold til Udacitys stil. Automatisk klassificerede quizzer følger ofte disse korte videoer. Disse quizzer er normalt multiple choice, fill-in-the-blank eller små programmeringsopgaver. Efter at have erhvervet CloudLabs udføres disse programmeringsopgaver nu i Jupyter Notebook- og SQL-kodningsmiljøer i Udacity-klasseværelset.

Igen har hver sektion et klassificeret projekt. Disse projekter og feedback fra Udacitys betalte projektanmeldere er, hvor meget af værdien ligger for studerende.

Pensum

Min udgave af programmet havde syv dele:

  • P1: Beskrivende og inferentiel statistik
  • P2: Introduktion til dataanalyse (med NumPy og pandaer)
  • P3: Data Wrangling med MongoDB (eller SQL)
  • P4: Eksplorativ dataanalyse (med R)
  • P5: Introduktion til maskinlæring
  • P6: Datavisualisering med D3.js
  • P7: Design en A / B-test

Det nye programs første periode kaldes dataanalyse med Python og SQL . Kurserne og projekterne inkluderer:

  • Intro-projekt: Udforsk vejretendenser. SQL og regneark (eller Python / R, hvis du allerede er bekendt) bruges til at analysere og visualisere temperaturdata.
  • Kursus: Introduktion til Python. Projekt: Udforsk amerikanske Bikeshare-data.
  • Kursus: Introduktion til dataanalyse, som inkluderer dataanalyseprocessen og SQL til dataanalyse. Projekt: Undersøg et datasæt.
  • Kursus: Praktisk statistik. Projekt: Analyser A / B-testresultater.

Den anden periode kaldes Advanced Data Analysis . Kurserne og projekterne inkluderer:

  • Intro-projekt: Test et perceptuelt fænomen. Beregn beskrivende statistik og udfør en statistisk test på et datasæt baseret på et psykologisk fænomen kaldet Stroop Effect.
  • Kursus: Data Wrangling (med Python). Projekt: Wrangle and Analyze Data. Dette er det kursus og projekt, jeg oprettede. ?
  • Kursus: sonderende dataanalyse (med R). Projekt: Udforsk og opsummer data.
  • Kursus: Data Storytelling (med Tableau). Projekt: Opret en Tableau-historie.

De store ændringer, med alle detaljer beskrevet i dette blogindlæg:

  • Python undervises nu i programmet.
  • Maskinindlæring og A / B-test er nu inkluderet som valgfrit materiale og er ikke længere krav for at opgradere fra programmet. Begrundelse: “Fokus for dette program er at forberede dig på dataanalytikerjob. Vores forskning viser, at maskinlæring ikke er et krav for langt størstedelen af ​​dataanalytikerstillinger. ” Grundlæggende om A / B-test er nu dækket af det nye praktiske statistik-kursus, der giver eleverne den eksponering, de har brug for på jobbet.
  • Nye kurser og projekter. Specifikt Introduktion til dataanalyse (som inkluderer Python til dataanalyse og SQL til dataanalyse), Praktisk statistik (undervist af Sebastian Thrun) og Data Wrangling.

Gradering

Projekter klassificeres som bestået / ikke bestået (officielt "opfylder specifikationer" og "kræver ændringer") i henhold til en unik rubrik. Dit projekt skal tilfredsstille alle sektioner i rubrikken. Hvis alle dine projekter overholder specifikationerne, går du op. Dette betyder, at de automatisk klassificerede quizzer ikke tæller med i din karakter.

Hvis en projektindsendelse kræver ændringer, vil din projektanmelder give dig handlingsmæssig feedback. Når du har implementeret disse ændringer, kan du sende den igen. Der er ingen begrænsning for indsendelse.

Min erfaring

Tidslinje

Udacitys anslåede tidslinje for Data Analyst Nanodegree-programmet var 378 timer, da jeg startede, hvilket betød, at studerende i gennemsnit tog 6-7 måneder på at gennemføre det. Ifølge Toggl (en tidssporingsapp) tog hele programmet mig 369 timer over fem måneder. Denne tidslinje omfattede at afsætte seriøs tid til at gøre mine projekter til porteføljekvalitet, i modsætning til at producere minimum for at tilfredsstille bestået / ikke-godkendt rubrikken.

Programmet blev kondenseret i opdateringen fra efteråret 2017. Den nye estimerede tidslinje er 260 timer . Hver periode sættes på 10 timer om ugen over 13 uger, selvom de studerende får 19 uger til at gennemføre hvert semester.

Hvordan var kursets indhold?

For min udgave af programmet får kursusindholdet fra P1 (Statistik), P2 (Introduktion til dataanalyse), P4 (Eksplorativ dataanalyse), P5 (Machine Learning) og P7 (A / B-test) fem stjerner ud af fem fra mig. P3 (Data Wrangling) og P6 får tre og en halv stjerne.

Det sonderende dataanalyseindhold med Facebook-medarbejdere (P4) var så oplysende. Introduktionen til maskinlæringskursus med Sebastian Thrun og Katie Malone (P5) var det sjoveste, jeg har haft i ethvert onlinekursus. A / B-testindholdet med Google-medarbejdere (P7) er så unikt. Jeg ville give disse tre kurser seks stjerner, hvis jeg kunne.

SQL og Data Wrangling-indholdet (P3) var ikke fantastisk. Samme med datavisualiseringsindholdet (P6), selvom det sandsynligvis var fordi D3.js er super vanskeligt at lære til JavaScript-nybegyndere. Disse meninger er ikke ualmindelige, ifølge Class Centers anmeldelser for disse kurser. Tjek dem her og her.

Dette "ikke fantastiske" indhold fra det gamle program blev fjernet i efteråret 2017-opdateringen. Fornyet indhold til introduktion til dataanalyse, SQL, statistik, datakørsel og datavisualisering er nu inkluderet. Indholdet af praktisk statistik fokuserer på inferentiel statistik, hvor beskrivende statistik er en forudsætning og undervises i programmet Data Foundations Nanodegree. Datavisualiseringskurset undervises nu med Tableau i stedet for D3.js.

Hvordan var projekterne?

Igen er projekter, hvor Udacity adskiller sig fra resten af ​​online-uddannelsesplatforme. De investerer i deres projektanmeldelsesproces, og det betaler sig. Data Analyst Nanodegree-programmet var ingen undtagelse.

Alle projekter styrker det indhold, du har lært i videoerne. Projektanmeldere kender deres ting. De fortæller dig, hvor du lykkedes, og hvor dine fejl og / eller undladelser er. Overvåget læring ved at gøre. Det virker.

Foraene og forummentorerne er især nyttige, når du sidder fast. Søg i fora for at se, om dit problem er almindeligt (de er normalt). Intet held? Indsend et nyt spørgsmål selv. Der er en forummentor, Myles Callan, der ser ud til at vide alt om alt og reagerer inden for få timer. Jeg er i tvivl om, at han sover.

Selvom fora stadig eksisterer og fungerer, er Slack og klasselære mentorer nu de anbefalede supportveje. Studerende kan stille spørgsmål, og svarene får samme eller større grad af øjeblikkelighed (inden for timer og ofte før). Slack-samfundet overvåges af Udacity-instruktører såvel som deres studenterfaringsmedarbejdere, der sikrer, at studerendes spørgsmål, kommentarer osv. Behandles rettidigt. Den berømte Myles Callan er nu mentor.

Hvis du er nysgerrig efter at se, hvordan disse projekter ser ud, skal du tjekke dette Github-lager.

Hvor svært var det?

Statistikindholdet var let for mig, fordi jeg havde taget flere statistikkurser i undergrad. Dette ville sandsynligvis være tilfældet for hvert emne i Nanodegree-programmet, hvis du havde tidligere erfaring med det.

Jeg vil kategorisere det meste af programmet som mellemliggende vanskeligheder. Forelæsningsindhold, der ikke har mange quizzer (det gør de dog ofte), kan være en leg, hvilket ikke nødvendigvis er en dårlig ting. Projekterne udøver din hjerne. Hver vil sandsynligvis tage dig mere end tyve timer, hvis du vil være grundig.

Det udforskende dataanalyseprojekt var det mest udfordrende at bestå. Det tog mig 3,5 indlæg. Tjek denne Twitter-tråd for flere detaljer.

Kan du søge job straks efter eksamen?

Du kan. Programmet skal udstyre dig med de krævede færdigheder til en entry-level dataanalytikerrolle, hvis du tager det seriøst. Eli Kastelein er et perfekt eksempel på det. Du kan læse mere om hans historie nedenfor.

Sådan opbygges en karriere inden for teknologi uden en CS-grad

I foråret 2014 var jeg et nyt college dropout på en Greyhound-bus, der ikke var på vej nogen særlig. medium.com

Du kan også fortsætte med mere avancerede kurser, både for de emner, der er omfattet af programmet og for andre emner. Dette er hvad jeg valgte at gøre.

Afsluttende tanker

Ville jeg tage programmet igen ved at vide, hvad jeg ved nu?

Et eller andet sted mod slutningen af ​​programmet begyndte jeg at oprette Class Centers karrierevejledning til datavidenskab. Dette medførte at undersøge hvert eneste online kursus, der blev tilbudt til hvert emne inden for datalogi.

Selvom jeg nød de fleste kurser inden for Nanodegree-programmet (opdatering: nye kurser har erstattet de kurser, jeg ikke nød) , er der kurser fra andre udbydere, der får bedre anmeldelser for visse fag. Statistik, for eksempel. Hvis jeg havde adgang til min guide tilbage, da jeg startede, ville jeg overveje den separate kursus-for-hvert fag-rute. Udacitys studenttjenester og projektanmeldelsesproces er dog så effektive til at lære, at jeg ville tage Data Analyst Nanodegree-programmet uanset.

Hvis du er den slags person, der ønsker en 100% brugerdefineret onlineuddannelsesoplevelse, men ønsker at drage fordel af Udacitys projekter og tjenester, undersøge dine foretrukne kurser for hvert fag (jeg anbefaler at bruge Class Central) og derefter tilmelde dig Nanodegree-programmet for at gennemføre projekterne er noget at overveje.

Alternativerne

Dette er de fem alternative programmer, som jeg overvejede, da jeg tilmeldte mig Data Analyst Nanodegree-programmet:

  • Johns Hopkins University's Data Science Specialization on Coursera
  • Microsofts professionelle programcertifikat i datavidenskab på edX
  • Wesleyan University's dataanalyse og fortolkning specialisering på Coursera
  • DataCamps Python- og R-spor
  • Dataquests stier for dataanalytiker og dataforsker

Bemærk: Jeg har fjernet mine kommentarer til disse programmer på grund af Udacity-politikken vedrørende kommentarer til andre udbydere.

Konklusion

Udacitys Data Analyst Nanodegree-program giver dig de grundlæggende færdigheder, du har brug for til en karriere inden for datavidenskab. Efter eksamen er du i stand til at målrette mod dine styrker og svagheder og supplere din læring, hvor det er nødvendigt. Derudover forlader du en håndfuld porteføljeklare projekter.

Jeg elskede det, ligesom andre gjorde.

★★★★ ¾