Vad är en datasjö?

Vad är en datasjö?

När det gäller cloud computing är termerna vi använder nästan lika viktiga som den data vi lagrar och analyserar. Företag som kommunicerar om hur data lagras, hämtas, nås och arkiveras i molnet tenderar att maximera användningen av denna data. Detta leder till bättre produkter, högre intäkter för företaget och högre tillväxt. Mer än något annat möjliggör det bättre kommunikation mellan affärsenheter, IT och till och med bankomater, försäljning, marknadsföring, kunder och affärspartners. En av termerna som har använts flitigt de senaste åren är en datasjö. Före spridningen av cloud computing, och redan innan Internet användes allmänt för att överföra data, använde cloud computing-experter termen datalager, men det räckte inte. Som namnet antyder består ett datalager, på grund av hur detta "lager" är organiserat, av data som ett företag bearbetar, analyserar och återanvänder som en del av att hantera sin molnlagring. För en återförsäljare kan ett datalager innehålla all information om produkten, SKU (lagerhanteringsenheter) och priser. Ett datalager är i allmänhet optimerat för snabb och pålitlig åtkomst. En datasjö är inte särskilt organiserad. Cloud computing-experter har börjat använda termen data lake för att skilja mellan strukturerad och ostrukturerad datalagring kontra ett datalager. Med en datasjö finns det inget antagande om dataoptimering. Det finns dock uppenbara fördelar. En datasjö kan innehålla en mängd olika data, men företag kan fortfarande köra dataskanningar, de kan fortfarande använda en instrumentpanel och de kan fortfarande använda data i en applikation eller andra bearbetningsuppgifter. Även om det är en allmän term som kan består av enorma datapooler, är mycket skalbar och användbar för flera ändamål, en sjö Data är också ett generiskt sätt att beskriva oorganiserad och organiserad data.

Nyckelkomponenter

För att förstå en datasjö och hur den hjälper företag att komma åt datamolninformation utan behov av dataoptimering och omstrukturering, är det också viktigt att förstå nyckelkomponenterna. En datasjö involverar ofta maskininlärning, ett sätt att förstå och bearbeta data med hjälp av automatiserade metoder. I händelse av att en återförsäljare behöver komma åt produktinformation kan maskininlärning bestämma SKU:erna som lagras i en datasjö och extrahera dessa data till en applikation. IT Service Management behöver inte först organisera data. Analys är ett annat nyckelelement. Med de flesta strukturerade affärsdata är det viktigt att ha en databas som gör att IT-proffs kan generera rapporter, köra SQL-frågor eller använda data på ett logiskt och förutsägbart sätt. . Tänk på ett typiskt vårdföretag som behöver strukturerad data tillgänglig för analys och rapportering av medicinsk personal; de behöver vanligtvis finnas i en centraliserad databas i molnet och optimerade för användning (t.ex. lagras i ett datalager). . Företag kan dock fortfarande köra analyser på en datasjö utan att först behöva optimera datan, vilket är en av de främsta fördelarna. Faktum är att allt eftersom maskininlärning och dataoptimering förbättras, blir ett datalager med strukturerad och ostrukturerad data ännu mer värdefull. En sista komponent i en datasjö: Data är inte alltid tänkt att användas i molnet. Även om ett datalager kan optimeras för användning på plats eller i molnet, kan en datasjö innebära att data flyttas för lokal användning i en intern applikation (en applikation som hämtar data från sina egna servrar) eller kan användas externt ( använder molnbaserad onlinelagring och datordatalager).

Hur tjänar företaget på det?

För att förstå termen datasjö är det viktigt att tänka på hur företag får tillgång till data. Det är inte så "rent" som man kan tro. Ibland anländer data slumpmässigt (kallas ostrukturerad data) och överförs till ett arkiv; Företag känner inte alltid till den ursprungliga källan till uppgifterna. Ibland lagras det i en relationsdatabas som används för en professionell app, ibland är det en datauppsättning för sociala medier eller något som matar en mobilapp som används av externa kunder. Huvudpoängen här är att en datasjö ger större flexibilitet i hur ett företag kan använda datan. Därför, medan ett datalager är ett mer strukturerat och optimerat sätt för datadrivet värdskap för ett specifikt ändamål, är en datasjö tillräckligt flexibel för flera användningsområden. Det finns ingen anledning att först skapa ett tydligt och tydligt användningsmönster för data och lagra det specifikt i en databas. Den är alltid tillgänglig, kan användas för flera ändamål och olika applikationer och är designad för lokal bearbetning på dina egna servrar eller nås från molnet. Han är redo för vad som helst.