Hur övar jag Hadoop online?
Som en av de mest kraftfulla programmeringsramarna för öppen källkod är Hadoop ett viktigt verktyg för alla som hoppas hitta ett big data-jobb. Om du vill förstärka dina Hadoop-färdigheter eller lära dig att behärska det är ditt bästa alternativ att ta en online-kurs. Om det inte är tillgängligt för dig kan du titta på gratis onlinehandledning och använda referensmaterial för att felsöka specifika problem. När du har lagt ner grunderna kan du öva på små uppsättningar av verkliga data för att förbättra dina färdigheter.
Metod 1 av 2: ta kurser och använda tutorials
- 1Registrera dig för cloudera för en 6-delad kurs och interaktiva handledning. Cloudera ger dig verkliga exempel att öva på i en skrivskyddad miljö, så du behöver inte oroa dig för att göra stora misstag. De erbjuder också analytiska verktyg som hjälper dig att experimentera med att fråga data, samt en gratis live-demo som heter Cloudera Live för att lära dig Hadoop-miljön.
- Även om den kompletta, fördjupade kursen med certifiering kostar dig 220€, kommer det definitivt att vara värt det om du använder dessa färdigheter för ditt jobb. Att använda Cloudera-kursen hjälper dig att fånga misstag och spara tid, vilket gör att det snabbt betalar för sig själv!
- 2Prova gratis online-kurser genom cloudera om du redan känner till grunderna. Om du har erfarenhet av Hadoop och bara vill ha en uppfriskning kanske du inte behöver betala ut pengarna för 6-delars kursen. Kolla istället de gratis onlinekurserna på Cloudera Universitys webbplats.
- Det finns resurser för administratörer, utvecklare och dataanalytiker, så oavsett vilken roll du har bör du kunna hitta en lämplig kurs.
- 3Ta en kurs på universitetsnivå om kurser om du vill ha mer teori. Coursera är en välkänd, respekterad källa till programmeringskurser. Även om instruktionerna i allmänhet är mer teoretiska och inte innehåller så många löpande exempel, kan du öva vid sidan av handledningen och använda kursprojekten för att få praktisk erfarenhet.
- Du hittar den här kursen online på https://coursera.org/specializations/big-data.
- Kostnaden varierar mellan kurser, men Coursera erbjuder också ett ekonomiskt stöd till de som kvalificerar sig.
- 4Följ en gratis kurs om big data-universitetet för ett kostnadseffektivt alternativ. Om du inte vill betala för en online-kurs är Big Data University ett utmärkt alternativ. De har en tvådelad kurs, som först fokuserar på Hadoop-grunderna, sedan på programmering med Hadoop, och onlineformatet gör det enkelt att gå i din egen takt.
- Du hittar dessa kurser på https://cognitiveclass.ai.
- De erbjuder många handledning på engelska, såväl som japanska, spanska, portugisiska och ryska.
- 5Sök efter genomgångar på youtube om du behöver gratis, specifik utbildning. Det finns tusentals videor gjorda för att förklara Hadoop och hur man använder det. Det breda utbudet av videor ger dig flexibilitet, plus att det är gratis. Om du stöter på ett specifikt problem, sök på YouTube efter en video som leder dig igenom processen.
- Hadoop-handledning bör också vara ganska lätt att hitta, eftersom "hadoop" är en unik sökterm.
- 6Använd yahoos gratis handledning om du vill öva med ett virtuellt exempel. Dessa handledning är uppdelad i 7 moduler och de instruerar dig att installera och använda Hadoop från början. Detta är ett utmärkt alternativ för att förstärka specifika färdigheter om de är lite rostiga.
- Du kan hitta dessa handledning gratis på https://developer.yahoo.com/hadoop/tutorial/.
- 7Se IBMs öppen källkodsdokument för kostnadsfria och djupgående instruktioner. Detta är ett oerhört grundligt PDF-dokument med öppen källkod skapat av ett IBM-utbildningsinitiativ. Det går dig igenom Hadoop noggrant, steg för steg och ger tydliga skriftliga instruktioner.
- Du hittar den här PDF-filen på https://ibm.com/developerworks/data/library/techarticle/dm-1209hadoopbigdata/.
- Dessa instruktioner fungerar också bra när de paras ihop med en live demo som Cloudera.
Metod 2 av 2: övergång till verklig applikation
- 1Fråga om du kan implementera hadoop på jobbet för att träna med riktiga data. Lägg in en förfrågan med din chef eller chef, eller prata med dem en-mot-en om att ta med dessa nya färdigheter på arbetsplatsen. Detta är särskilt viktigt om ditt företag betalar för någon utbildning eller online-kurser.
- Ju tidigare du börjar implementera de färdigheter du har lärt dig, desto snabbare kommer du att kunna behärska dem!
- 2Leta efter enkla projekt att öva dina färdigheter på. Välj projekt som är relativt enkla och låga risker, som att räkna och rangordna antalet interaktioner per kundagent, som e-post och chatt sessioner.
- Några andra riktiga datatillämpningar inkluderar skanning genom webbloggar för fel eller övervakning av sociala mediekanaler för varumärkesentiment.
- Du kan också öva med exempeldata från webbplatser som https://kaggle.com/datasets eller https://aws.amazon.com/datasets/.
- 3Kontrollera regelbundet din kod med små delmängder för att ta reda på eventuella fel. Innan du kör hela uppsättningen data, ta en mindre testdatauppsättning till din lokala maskin och kör den genom flera olika lägen. Du kan till exempel köra det iterat genom Local Jobrunner Mode, sedan Pseudo-Distribuerat Mode och sedan Fullt Distribuerat Mode.
- Detta låter dig känna igen eventuella brister eller buggar innan de förstärks i hela datasetet.
- Lokalt Jobrunner-läge låter dig testa och felsöka din karta och minska koden lokalt, Pseudo-distribuerat läge efterliknar produktionsmiljön och fullt distribuerat läge tittar på ditt verkliga produktionskluster.
- 4Använd en 1-årig gratis provperiod för att öva på en virtuell maskinmiljö. Företag som Amazon och Microsoft erbjuder betalda prenumerationer för sina Hadoop-praxistjänster. Amazons virtuella maskinen är kallas Amazon Web Service (AWS) och Microsofts tjänst kallas Microsoft Azure. För båda tjänsterna är ditt första år gratis när du anger din kreditkortsinformation.
- Glöm inte att säga upp prenumerationen efter ett år för att undvika att debiteras.
- Tänk på att Hadoop är ett mer specialiserat programmeringsspråk med smal användning. Det kommer säkert att ge dig en fördel i big data-världen, men det är inte alltid nödvändigt att bli programmerare.
- Du kan också läsa böcker och artiklar om Hadoop, till exempel Hadoop: The Definitive Guide, 3: e upplagan av Tom White.
Relaterade artiklar