En oversigt over hvert datavisualiseringskursus på internettet

For et år siden faldt jeg ud af et af de bedste datalogiprogrammer i Canada. Jeg begyndte at oprette mit eget datalogi-masterprogram ved hjælp af online ressourcer. Jeg indså, at jeg i stedet kunne lære alt hvad jeg havde brug for gennem edX, Coursera og Udacity. Og jeg kunne lære det hurtigere, mere effektivt og for en brøkdel af prisen.

Jeg er næsten færdig nu. Jeg har taget mange datavidenskabelige kurser og revideret dele af mange flere. Jeg kender mulighederne derude, og hvilke færdigheder der er nødvendige for elever, der forbereder sig på en dataanalytiker eller datavidenskabsrolle. For et par måneder siden begyndte jeg at oprette en gennemgangsdrevet guide, der anbefaler de bedste kurser til hvert emne inden for datalogi.

Til den første guide i serien anbefalede jeg et par kodningskurser til nybegyndere. Så var det statistik og sandsynlighedsklasser. Så var det introduktioner til selve datavidenskaben.

Nu på datavisualisering.

Til denne vejledning brugte jeg 10+ timer på at prøve at identificere hvert online datavisualiseringskursus, der blev tilbudt fra marts 2017, udtrække nøglebits af information fra deres pensum og anmeldelser og udarbejde deres ratings. Til denne opgave henvendte jeg mig til ingen ringere end open source Class Central-samfundet og dets database med tusindvis af kursusbedømmelser og anmeldelser.

Siden 2011 har Class Central-grundlægger Dhawal Shah holdt øje med onlinekurser end uden tvivl nogen andre i verden. Dhawal hjalp mig personligt med at samle denne liste over ressourcer.

Hvordan vi valgte kurser til at overveje

Hvert kursus skal opfylde tre kriterier:

  1. Størstedelen af ​​kurset skal fokusere på forklarende datavisualisering. Dækning af dataforberedelse er f.eks. Tilladt, da det er en vigtig del af datavisualiseringsprocessen. Kurser, der dækker mindre relevante emner (f.eks. Statistisk modellering), er ekskluderet. Mere om den forklarende sondring nedenfor.
  2. Det skal være on-demand eller tilbydes hvert par måneder.
  3. Det skal være et interaktivt online kursus, så ingen bøger eller skrivebeskyttede tutorials . Selvom disse er levedygtige måder at lære, fokuserer denne guide på kurser.

Vi mener, at vi dækkede alle bemærkelsesværdige kurser, der passer til ovenstående kriterier. Da der tilsyneladende er hundredvis af kurser på Udemy, valgte vi kun at overveje de mest gennemgåede og højest vurderede. Der er dog altid en chance for, at vi savnede noget, så lad os det vide i kommentarfeltet, hvis vi efterlod et godt kursus.

Hvordan vi vurderede kurser

Vi har samlet en gennemsnitlig vurdering og et antal anmeldelser fra Class Central og andre anmeldelsessider for at beregne en vægtet gennemsnitlig vurdering for hvert kursus. Vi læste tekstanmeldelser og brugte denne feedback til at supplere de numeriske vurderinger.

Vi foretog subjektive pensumopkald baseret på to faktorer, med den første præference frem for den anden:

  1. Dækning af datavisualiseringsteori. Er motivationerne til visualiseringsvalg forklaret? Underviser kurset kun værktøjet? Mere om dette i det næste afsnit.
  2. Dækning af valgte datavisualiseringsværktøj (er). Underviser kurset effektivt almindelige visualiseringsværktøjer (Tableau, ggplot2, Seaborn osv.)? Har studerende mulighed for at øve disse færdigheder? Der foretrækkes ikke valg af værktøj.

Hvorfor prioritere visualiseringsteori

Beherskelse af et specifikt værktøj er spildt uden kendskab til fundamentet for effektiv visualisering. Plus, værktøjer er ofte udskiftelige afhængigt af indstillingen.

Mere vigtigt er det at gøre god datavisualisering mere kompleks, end de fleste mennesker tror. Der kræves omhyggelig tanke fra planlægningsfasen til udførelsen. Valg af det rigtige diagram, afvejning af kompleksitet og rod, udnyttelse af opmærksomme egenskaber og mere, datavisualisering er både en kunst og en videnskab. Det er let at gå galt og nogle gange forfærdeligt (se nedenfor).

Eksplorativ vs forklarende visualisering

Som beskrevet af Indiana University professor Yong-Yeol Ahn, er formålet med forklarende datavisualisering at kommunikere indsigt og meddelelser, mens målet med udforskende visualisering er at opdage skjulte mønstre.

Denne artikel fokuserer på forklarende datavisualiseringskurser. Kurser som Udacitys dataanalyse med R (udelukkende et sonderende kursus) er derfor udelukket fra denne artikel. Emnet er vigtigt; der er bare ikke nok kurser til at retfærdiggøre en enkeltstående artikel. Det vil blive kort beskrevet i den sammenfattende artikel for denne serie.

Kodningsoplevelse kræves nogle gange

Nogle kurser, der er anført nedenfor, kræver grundlæggende kodningsfærdigheder på kursets undervisningssprog. Hvis du har meget lidt programmeringserfaring, ville vores anbefalinger i den første artikel i denne serie - den bedste introduktion til programmeringskurser for datalogi - være en god start. Både Python- og R-kurser er dækket.

Gennemgå data mangler

Sammenlignet med de andre artikler i denne serie mangler der gennemgangsdata til datavisualiseringskurser, der passer til ovenstående kriterier. Der er heller ikke noget klart bedste datavisualiseringskursus endnu. Anbefalingerne nedenfor er derfor ikke så afgørende som tidligere artikler. Som altid, men især her, skal du prøve at vælge det kursus, der bedst passer til dine behov.

Vores valg til det bedste datavisualiseringskursus er ...

  • Datavisualisering med specialisering af tabletter ved University of California, Davis på Coursera

... som indeholder følgende fem kurser:

  • Fundamentals of Visualization with Tableau
  • Væsentlige designprincipper for Tableau
  • Visual Analytics med Tableau
  • Oprettelse af dashboards og historiefortælling med Tableau
  • Datavisualisering med Tableau-projekt

University of California, Davis 'Data Visualization with Tableau Specialization har den bedste kombination af teori og værktøjsdækning til rådighed baseret på denne artikels evalueringskriterier. Det dykker dybt ned i teorien som få andre kurser. Der er muligheder for at øve Tableau via walkthroughs og et afsluttende projekt, selvom mastering af Tableau ikke er hovedfokus. Det er en ret ny specialisering (sidst i 2016), og kurserne har kun en 4- stjernet vurdering imellem på de gennemgangssider, der er brugt til denne analyse.

Govind Acharya, Hunter Whitney og Suk Brar er instruktører. Acharya er en hovedanalytiker ved UC Davis. Whitney og Brar er respekterede fagfolk inden for branchen. Mellem dem har de årtier med datavisualiseringserfaring, der tydeligt formidles gennem kursets indhold. Videoerne er godt produceret.

Den estimerede tidslinje for specialiseringen på Coursera er 22 uger med ugentlige forpligtelser fra tre til otte timer om ugen. Disse skøn er helt sikkert for høje, som bemærket af flere korrekturlæsere og min erfaring med Coursera. Der er i øjeblikket gratis (auditering af hvert kursus individuelt) og betalt (betalt for specialiseringen) muligheder.

Flere fremtrædende korrekturlæsere på Coursera bemærkede følgende:

De fortæller dig ikke kun, hvordan man gør visualiseringsdesignet, men fortæller også hvorfor (fysiologien, principperne). Jeg vil meget anbefale denne klasse. Fantastisk kursus - beskytter mod nogle subtile faldgruber i visualiseringsforberedelse. Selvom en meget grundlæggende introduktion til brugen af ​​Tableau, giver kurset en bred og interessant baggrund, der skal vise sig nyttig for alle, der søger at forbedre deres forståelse af visualisering grundlæggende.

Visualiseringsteori og R, lært ved at gøre

  • Datavisualisering med ggplot2 af DataCamp

... for hvilke der er tre dele:

  • Datavisualisering med ggplot2 (del 1)
  • Datavisualisering med ggplot2 (del 2)
  • Datavisualisering med ggplot2 (del 3)

En anden god mulighed er DataCamps datavisualisering med ggplot2-serien, især hvis du vil lære R og mere specifikt ggplot2. En væsentlig mængde teori er dækket, hvilket er passende, da ggplot2 er inspireret af The Grammar of Graphics. Værktøjsdækning og øvelse er også imponerende - du vil kende R og dens underlige syntaks ganske godt, når de forlader disse kurser. Der er ingen anmeldelser for disse kurser på de gennemgangssider, der er brugt til denne analyse.

Instruktøren for alle tre kurser er Rick Scavetta, der er biolog, workshop-træner, freelance data-videnskabsmand og medstifter af Science Craft. DataCamps hybrid undervisningsstil udnytter video (med Scavetta i hovedrollen) og tekstbaseret instruktion med mange eksempler gennem en in-browser-kodeditor. Video-, tekst- og kodeindholdet poleres pænt.

Tilsammen er den estimerede tidslinje for alle tre kurser 16 timer. Det første kapitel i hvert kursus er gratis. Et DataCamp-abonnement, der i øjeblikket er $ 29 pr. Måned eller $ 300 pr. År, kræves for fuld adgang.

Følgende påtegning er fra Hadley Wickham, Chief Scientist hos RStudio og ggplot2 skaberen:

Jeg anbefaler grundigt “Data Visualization with ggplot2” af Rick Scavetta. Det giver dig en fremragende introduktion til ggplot2. Du lærer både den underliggende teori og får praksis på DataCamps online læringsmiljø.

En praktisk introduktion til Tableau med en fremragende instruktør

Tableau 10-serie af Kirill Eremenko og SuperDataScience-teamet på Udemy, som inkluderer:

  • Tableau 10 AZ: Praktisk Tableau-træning til datalogi!
  • Tableau 10 Advanced Training: Master Tableau in Data Science

Undervisning af Kirill Eremenko, SuperDataScience's Tableau 10 Series er en effektiv praktisk introduktion. Det fokuserer hovedsageligt på værktøjsdækning (Tableau) snarere end teori om datavisualisering. Eremenko er en af ​​de mest velansete instruktører i disse guider med konsekvent positive anmeldelser på tværs af sine kurser. AZ-kurset er en forudsætning for Advanced Training-kurset. Tilsammen har banerne i serien en 4,6-stjernet vægtet gennemsnitlig bedømmelse over 3.724 anmeldelser.

Serien har sytten timers videoindhold. Omkostningerne ved hvert kursus varierer afhængigt af Udemy-rabatter, men disse er hyppige og kan købes for så lidt som $ 10.

Flere fremtrædende korrekturlæsere bemærkede følgende:

Dette var fantastisk. Jeg bruger Tableau dagligt, men det var en fantastisk genopfriskning på nogle af de ting, jeg ikke bruger, og et godt studiehjælpemiddel til at sidde i Tableau Certified Professional Exam. Godt arbejde Kirill og teamet!

Kirill er en enorm lærer, og studerende, der tager dette kursus, vil tydeligt se, hvorfor han har snesevis af kurser og tusindvis af studerende - han er i stand til at undervise i komplekse færdigheder i en reel verdens forretningskontekst og gøre det trinvist og derved kombinere den ofte komplekse opgave med at undervise begge grundlæggende og kontekstspecifikke applikationer samtidigt.

Konkurrencen

Lad os se på de andre alternativer sorteret efter faldende vurdering.

Interaktiv datavisualisering med Python & Bokeh (Ardit Sulce / Udemy): Værktøjsfokus (Python og Bokeh). Inkluderer et afsnit om oprettelse af webapplikationer. Syv timers video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Den har en 4,6- stjernet vægtet gennemsnitlig vurdering over 103 anmeldelser.

Information Visualization (IVMOOC) (Indiana University / Independent): Dækker teori og flere værktøjer i detaljer. Imponerende virkelige projekt. Registrering fungerede ikke, når du forsøgte det på trods af e-mails til kursusadministratorerne. Et fuldt tolv-ugers kandidatkursus. Ledig. Den har en 4,5- stjernet vægtet gennemsnitlig vurdering over 2 anmeldelser.

Tableau for begyndere - Bliv certificeret Fremskynd din karriere (Lukas Halim / Udemy): Værktøjsfokus (Tableau). Fire timers video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Det har en 4,5- stjernet vægtet gennemsnitlig vurdering over 649 anmeldelser.

Analyse og visualisering af data med Power BI (Microsoft / edX): Værktøjsfokus (Power BI). Skræddersyet til forretningsbrugere, der investeres i Microsofts økosystem. En del af Microsoft Professional Program Certificate i Data Science. Anslået tidslinje på to til fire timer om ugen over seks uger. Gratis med et bekræftet certifikat, der kan købes. Den har en 4,5- stjernet vægtet gennemsnitlig vurdering over 117 anmeldelser.

Analyse og visualisering af data med Excel (Microsoft / edX): Værktøjsfokus (Excel). Skræddersyet til forretningsbrugere, der investeres i Microsofts økosystem. En del af Microsoft Professional Program Certificate i Data Science. Anslået tidslinje på to til fire timer om ugen over seks uger. Gratis med et bekræftet certifikat, der kan købes. Det har en 4,5- stjernet vægtet gennemsnitlig vurdering over 972 anmeldelser.

Data visualiser data med D3.js The Easy Way (Infinite Skills / Udemy): Værktøjsfokus (D3.js). Fire timers video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Det har en 4,4- stjernet vægtet gennemsnitlig vurdering over 262 anmeldelser.

Datavisualisering med Python og Matplotlib (Stone River eLearning / Udemy): Værktøjsfokus (Python og Matplotlib). Seks timers video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Den har en 4,4- stjernet vægtet gennemsnitlig vurdering over 92 anmeldelser.

Dataanalyse: Visualisering og Dashboard Design (Delft University of Technology / edX): Værktøj (Excel) og forretningsfokus. Anslået tidslinje på fire til seks timer om ugen over seks uger. Gratis med et bekræftet certifikat, der kan købes. Det har en 4,2- stjernet vægtet gennemsnitlig vurdering over 5 anmeldelser.

Big Data: Data Visualization (Queensland University of Technology / FutureLearn): Balanceret teori / værktøjsfokus. Eksponering for en række forskellige værktøjer. Starter i august 2017. Anslået tidslinje på to timer om ugen over tre uger. Gratis med en "opgradering", der kan købes. Det har en 4- stjernet vurdering over 1 anmeldelse.

Datavisualisering og kommunikation med Tableau (Duke University / Coursera): Værktøj (Tableau) og forretningsfokus. En del af Excel til MySQL: Analytiske teknikker til forretningsspecialisering. Anslået tidslinje på seks til otte timer om ugen over fem uger. Gratis og betalte muligheder til rådighed. Det har en 3,67- stjernet vægtet gennemsnitlig vurdering over 9 anmeldelser.

Datavisualisering (University of Illinois i Urbana-Champaign / Coursera): Teorifokus. En del af Data Mining Specialization. Anslået tidslinje på fire til seks timer om ugen over fire uger. Gratis og betalte muligheder til rådighed. Den har en 3,14- stjernet vægtet gennemsnitlig vurdering over 22 anmeldelser.

Datavisualisering og D3.js (Udacity): Balanceret teori / værktøjsfokus. D3.js instruktionen føles "ufuldstændig" og "malplaceret." Anslået tidslinje på syv uger. Ledig. Det har en 2,83- stjernet vægtet gennemsnitlig vurdering over 6 anmeldelser.

Datastyring og visualisering (Wesleyan University / Coursera): Balanceret teori / værktøjsfokus. Dækker flere værktøjer (Python og SAS). En del af Wesleyans specialisering af dataanalyse og fortolkning. Anslået tidslinje på fire til fem timer om ugen over fire uger. Gratis og betalte muligheder til rådighed. Den har en vejd gennemsnitsvurdering på 2,67 stjerner over 6 anmeldelser.

Anvendt tegning, kortlægning og datarepræsentation i Python (University of Michigan / Coursera): Balanceret teori og værktøjsfokus. Gratis og betalte muligheder til rådighed. Det har en 2- stjernet vægtet gennemsnitlig vurdering over 4 anmeldelser.

De følgende kurser havde ingen anmeldelser pr. Marts 2017.

Datavisualisering i tablet (Udacity): Teorifokus med fremragende dækning. Kort værktøjsdækning (Tableau). Primært tekstbaseret instruktion med multiple choice quizzer. En del af Udacitys dataanalytiker Nanodegree og Predictive Analytics for Business Nanodegree. Dette kursus er sandsynligvis bundet til et top tre sted, når det opdateres med videoer for at supplere teksten. Anslået tidslinje på tre uger. Ledig.

Building Data Visualization Tools (Johns Hopkins University / Coursera): Værktøjsfokus (R og ggplot2). En del af JHU's Mastering Software Development in R Specialization. Anslået tidslinje på to timer om ugen over fire uger. Gratis og betalte muligheder til rådighed.

Datavisualisering for alle (Trinity College / edX): Teorifokus. Anslået tidslinje på tre timer om ugen over seks uger. Gratis med bekræftet certifikat kan købes.

Datavisualisering med avanceret Excel (PwC / Coursera): Værktøjsfokus (Excel). En del af PwCs dataanalyse og præsentationsevner: PwC-tilgangsspecialiseringen. Anslået tidslinje på tre til fire timer om ugen over fire uger. Gratis og betalte muligheder til rådighed.

Kommunikation af Business Analytics-resultater (University of Colorado Boulder / Coursera): Teori og forretningsfokus. En del af Colorado Boulders dataanalyse til specialiserede bootcamp-virksomheder. Anslået tidslinje på fire uger. Gratis og betalte muligheder til rådighed.

Storytelling Through Data Visualization (Dataquest): For det meste et værktøjsfokus (Python, Matplotlib og Seaborn). Anslået tidslinje uklar. For det meste gratis, men der kræves et abonnement for fuld adgang.

Data Visualization Learning Path (O'Reilly): Balanceret værktøj / teorifokus. Dækker D3.js. Flere instruktører. Femten timers indhold. Gratis med en ti-dages gratis prøveperiode.

Datavisualisering for udviklere (Dan Appleman / Pluralsight): Teorifokus. Skræddersyet til udviklere. To timers indhold. Gratis med en ti-dages gratis prøveperiode.

De følgende fire kurser er oprettet af Bill Shander fra Beehive Media og tilbydes på Lynda. De er anført i kronologisk rækkefølge efter udgivelsesdato.

Grundlæggende datavisualisering (Bill Shander / Lynda): Teorifokus. Fire timers indhold. Gratis med en ti-dages gratis prøveperiode.

Design af en datavisualisering (Bill Shander / Lynda): Teorifokus. Omfatter oprettelse af et specifikt projekt fra koncept til dataanalyse til design og udførelse. Fire timers indhold. Gratis med en ti-dages gratis prøveperiode.

Datavisualisering for dataanalytikere (Bill Shander / Lynda): Teorifokus. Skræddersyet til dataanalytikere. To timers indhold. Gratis med en ti-dages gratis prøveperiode.

Data Visualization Storytelling Essentials (Bill Shander / Lynda): Teorifokus. To timers indhold. Gratis med en ti-dages gratis prøveperiode.

Visualisering i R, fra begynder til avanceret (Nathan Yau / FlowingData): Et fire-ugers kursus. Abonnement kræves.

De følgende fire kurser tilbydes af DataCamp. Som nævnt ovenfor udnytter DataCamps hybrid undervisningsstil video- og tekstbaseret instruktion med mange eksempler gennem en in-browser-kodeditor.

Datavisualisering i R (DataCamp): Balanceret teori / værktøjsfokus. Dækker base R-grafik. Anslået tidslinje på fire timer. Abonnement kræves for fuld adgang.

Introduktion til datavisualisering med Python (DataCamp): Værktøjsfokus (Python, Matplotlib og Seaborn). Anslået tidslinje på fire timer. Abonnement kræves for fuld adgang.

Interaktiv datavisualisering med Bokeh (DataCamp): Værktøjsfokus (Python og Bokeh). Anslået tidslinje på fire timer. Abonnement kræves for fuld adgang.

Datavisualisering i R med ggvis (DataCamp): Balanceret teori / værktøjsfokus. Dækker R og ggvis. Anslået tidslinje på fire timer. Abonnement kræves for fuld adgang.

Pakning af det

Dette er den fjerde af en seks-delt serie, der dækker de bedste online kurser til at starte dig selv ind i datavidenskabsfeltet. Vi dækkede programmering i den første artikel, statistik og sandsynlighed i den anden artikel og introduktioner til datalogi i den tredje artikel. Den resterende del af serien dækker andre kernekompetencer inden for datalogi. Derefter er maskinindlæring.

Hvis du vil lære datalogi, skal du starte med en af ​​disse programmeringsklasser

medium.freecodecamp.com Hvis du vil lære Data Science, skal du tage et par af disse statistikklasser

medium.freecodecamp.com Jeg rangerede hvert Intro til Data Science-kursus på internettet, baseret på tusindvis af datapunkter

medium.freecodecamp.com

Det sidste stykke vil være et resumé af disse artikler plus de bedste onlinekurser til andre nøgleemner såsom datakørsel, databaser og endda software engineering.

Hvis du leder efter en komplet liste over datavidenskab online-kurser, kan du finde dem på Class Centers side om datalogi og big data.

Hvis du kunne lide at læse dette, så tjek nogle af Class Centrals andre stykker:

Her er 250 Ivy League kurser, du kan tage online lige nu gratis

250 MOOC'er fra Brown, Columbia, Cornell, Dartmouth, Harvard, Penn, Princeton og Yale. medium.freecodecamp.com De 50 bedste gratis online universitetskurser i henhold til data

Da jeg lancerede Class Central i november 2011, var der omkring 18 gratis online kurser og næsten hele ... medium.freecodecamp.com

Hvis du har forslag til kurser, jeg savnede, så lad mig det vide i svarene!

Hvis du fandt dette nyttigt, skal du klikke på? så flere mennesker vil se det her på Medium.

Dette er en kondenseret version af min originale artikel offentliggjort på Class Central, hvor jeg har inkluderet yderligere kursusbeskrivelser, pensum og flere anmeldelser.