Weka Tutorial - GUI-baseret maskinindlæring med Java

I dag er programmeringssprog som Python og R utvivlsomt nogle af de mest efterspurgte sprog inden for datalogi og maskinindlæring.

Men er det også muligt at udføre almindelige maskinlærings- og datalogiske opgaver uden nødvendigvis at være dygtige i kodning?

Selvfølgelig er det det! Weka er en grafisk brugergrænseflade-baseret open source-pakke. Det kan bruges til at udføre almindelige Data Science-opgaver bare ved hjælp af den grafiske grænseflade.

Grundlæggende

Weka kan let installeres på enhver type platform ved at følge instruktionerne på følgende link. Den eneste forudsætning er at have Java 8.0 installeret på din lokale maskine.

Når du har installeret Weka, har du et sæt standard databehandling og inferens teknikker som:

  • Forbehandling af data : Når du har indlæst et datasæt, giver Weka dig mulighed for hurtigt at udforske dets attributter og forekomster. Derudover er forskellige filtreringsteknikker tilgængelige for f.eks. At konvertere kategoriske data til numeriske eller udføre funktionsvalg for at reducere dimensionaliteten af ​​vores datasæt (f.eks. For at fremskynde træningstider og ydeevne).
  • Klassifikations- og regressionsalgoritmer:en samling af forskellige algoritmer som Gaussian Naive Bayes, Beslutningstræer, K-nærmeste nabo, ensembleteknikker og forskellige lineære regressionsvarianter.
  • Klyngedannelse: denne teknik kan bruges til at identificere hovedkategorierne i vores data på en ukontrolleret måde. Nogle eksempler på algoritmer, der er tilgængelige i Weka-samlingen, er K-Means Clustering og Expectation Maximization.
  • Discovering Associations: at opdage regler i vores datasæt for lettere at identificere mønstre og forbindelser mellem de forskellige funktioner.
  • Datavisualisering:en række integrerede datavisualiseringsteknikker til hurtigt at visualisere sammenhænge mellem funktioner og repræsentere indlærte maskinlæringsmønstre såsom beslutningstræer og K-Means Clustering.

Et andet interessant træk ved Weka er muligheden for at installere nye pakker, når de oprettes.

Et eksempel på en ekstra pakke, du kan installere, er AutoML. AutoML kan faktisk være særligt nyttigt for begyndere, der måske har svært ved at identificere, hvilken maskinlæringsmodel der bedst kan bruges til en bestemt opgave.

Ved hjælp af Weka AutoML-pakken kan du nemt teste forskellige Machine Learning-modeller på farten. Det giver dig også mulighed for automatisk at indstille sine hyperparametre for at øge ydeevnen.

Endelig, for flere ekspertbrugere, tilbyder Weka også en kommandolinjegrænseflade til brug af Java-kode. Dette kan være særligt nyttigt, især hvis du arbejder med store mængder data.

Eksempel

Vi går nu gennem et simpelt eksempel for at demonstrere, hvordan vi kommer i gang med Weka.

Først og fremmest kan vi starte vores analyse ved at åbne Weka Explorer og åbne vores datasæt (i dette eksempel Iris-datasættet).

Vælg fanen Klassificer, vælg Naive Bayes som vores klassifikator, og klik på start. Du vil se, at vi hurtigt kan opnå 96% klassifikationsnøjagtighed uden at skulle skrive nogen kode!

Konklusion

Hvis du leder efter mere information om, hvordan du kommer i gang med Weka, er denne YouTube-serie fra Google Developers et godt sted at starte.

Kontakt mig

Hvis du vil holde dig opdateret med mine nyeste artikler og projekter, skal du følge mig på Medium og abonnere på min mailingliste. Dette er nogle af mine kontaktoplysninger:

  • Linkedin
  • Personlig blog
  • Personligt websted
  • Medium profil
  • GitHub
  • Kaggle

Forsidefoto fra denne artikel.