This is the Trace Id: e284858d96ca47ad1b7bb89b65a89ea1

Mikä on tietovarasto?

Hanki yleiskuva tietovaraston eduista ja käyttöönottoprosessista.

Tietovaraston määritelmä

Tietovarasto (data lakehouse) on yhtenäinen tietohallinta-arkkitehtuuri, joka yhdistää data lake- ja data warehouse -tallennusominaisuudet. Tämä mahdollistaa sekä rakenteisen että rakenteettoman datan tallentamisen ja analysoinnin. Se tukee joustavaa tietojen käsittelyä, kehittynyttä analysointia ja koneoppimista ja varmistaa samalla tietoturvan ja optimoidun suorituskyvyn.

Keskeiset huomiot

  • Hanki yleiskuva data lakehouse -tietovarastomallista ja sen merkityksestä nykypäivän datavetoisessa toimintaympäristössä.
  • Tutustu tietovaraston etuihin, kuten skaalautuvuuteen, tehostettuun tietoturvaan, parempaan suorituskykyyn ja tukeen erilaista tietoanalytiikkaa varten.
  • Lue tietoja keskeisistä komponenteista, jotka muodostavat tietovarastoarkkitehtuurin.
  • Hanki vaiheittaiset ohjeet parhaista tavoista toteuttaa tietovarastoarkkitehtuuri.
  • Katso, miten maailman huippuorganisaatiot hyödyntävät tietovarastoarkkitehtuuria suorituskyvyn parantamiseen.

Tietovaraston yleiskatsaus

Tämän päivän tietopohjaiset organisaatiot etsivät jatkuvasti innovatiivisia tapoja hyödyntää dataa. Uusimpia edistysaskeleita on data lakehouse -tietovarasto, arkkitehtuurikehys, joka yhdistää saumattomasti data lake- ja data warehouse -ratkaisujen vahvuudet yhteen ympäristöön. Tämä malli antaa organisaatioiden tallentaa suuria määriä sekä rakenteista, puolirakenteista että rakenteetonta dataa, jota voidaan sitten käyttää käsittelyyn, analysointiin ja näkemysten saamiseen ilman laajaa datan muuntamista.

Tietovarastot ovat keskeisiä nykyaikaisille tietostrategioille, koska ne ovat tarpeeksi joustavia tukemaan laajaa valikoimaa käyttötapauksia. Ne antavat datatiimeille mahdollisuuden suorittaa monimutkaisia kyselyitä ja koneoppimismalleja suoraan raakadatasta, mikä helpottaa yritykselle merkityksellisten tietojen muodostamista ja päätöksentekoa yhä datavetoisemmassa ympäristössä. Tietovarastot helpottavat myös tietovirtojen yhdistämistä, poistavat siiloja ja edistävät suurempaa yhteistyötä – säilyttäen samalla olennaiset ominaisuudet, kuten tiedonhallinnan, turvallisuuden ja suorituskyvyn.

Tietovaraston hyödyt

Skaalautuvuus ja joustavuus tiedonhallinnassa

Tietovarastot voivat skaalautua saumattomasti kasvavien datamäärien mukaan eri tietotyypeissä ja tarjota näin liiketoiminnalle ketteryyttä sopeutua muuttuviin tietoympäristöihin.

Microsoft OneLake Fabricissa on avoin data lake -tallennustila, joka voi skaalautua rajattomasti, vastaanottaa sekä rakenteista että rakenteetonta dataa ja käsitellä valtavia määriä tietoa optimoiden samalla suorituskykyä analytiikkamoduuleissa.

Tehostetut tiedonhallinta- ja suojausominaisuudet

Tietovarastot sisältävät vahvat suojaustoimet arkaluonteisten tietojen suojaamiseksi. Esimerkiksi OneLake käyttää alan johtavia suojaus- ja hallintatyökaluja varmistaakseen organisaatiosi datan laadun ja sen, että vain oikeilla ihmisillä on oikeus käyttää tietoja. Tämä auttaa organisaatiotasi pysymään vaatimustenmukaisena alan säädösten kanssa ja suojautumaan luvattomalta käytöltä.

Kustannus- ja suorituskyvyn tehokkuus

Kustannustehokkaan pilvitallennuksen ja optimoidun tietojen käsittelyn avulla tietovarastot tarjoavat edullisen ratkaisun sekä rakenteisen että rakenteettoman datan suuren määrän tallentamiseen ja analysoimiseen. Microsoft Fabric vähentää kustannuksia entisestään tarjoamalla yhden kapasiteetti- ja tallennusvarannon, jota voidaan käyttää kaikkia työmääriä varten.

Erilaisten tietoanalytiikan ja koneoppimisen sovellusten tuki

Antamalla datatieteilijöille ja -analyytikoille mahdollisuuden suorittaa reaaliaikaisia analyysejä suoratoistodatan avulla, tietovarastot sallivat organisaatioiden reagoida nopeasti ja ennakoivasti muuttuviin olosuhteisiin. Työmäärät, kuten Fabricin reaaliaikaiset tiedot, voivat käsitellä ja muuntaa suoratoistodataa, suorittaa kyselyjä reaaliajassa ja käynnistää toimintoja vastauksena.

Tietovarastoarkkitehtuuri

Tietovarastoarkkitehtuuri koostuu useista keskeisistä komponenteista, jotka toimivat yhdessä luodakseen yhtenäisen järjestelmän datan hallintaan ja analysointiin. Tässä on yksityiskohtainen erittely jokaisesta komponentista:

1. Tietojen käsittely. Käsittelykerros vastaa datan keräämisestä eri lähteistä, mukaan lukien tietokannat, sovellukset, IoT-laitteet ja ulkoiset ohjelmointirajapinnat, sekä erissä että reaaliaikaisesti. Fabric Data Factory mahdollistaa tietovirtojen ja -putkien toteuttamisen datan käsittelyä, valmistelua ja muuntamista varten monista eri lähteistä. Tämä kerros varmistaa, että kaikki olennainen data – rakenteinen, puolirakenteinen ja rakenteeton – on saatavilla analysoitavaksi, mikä tarjoaa kattavan näkymän organisaation toimintaympäristöön.

2. Tallennus. Tallennuskerros toimii tietovaraston perustana ja käsittelee suuria määriä raakadataa käyttämällä skaalautuvia ja kustannustehokkaita tallennusratkaisuja. Tämä kerros mahdollistaa datan tallentamisen sen raakamuodossa. Se säilyttää erilaisia datatyyppejä, kuten tekstiä, kuvia ja videoita, ja poistaa samalla tarpeen jäykille rakenteille, jotta data voi olla entistä skaalautuvampaa.

3. Metatiedot. Metatietokerros luetteloi tietoresurssit ja ylläpitää rakennetietoja, mikä varmistaa datan laadun tehokasta kyselyjen suorittamista varten. Datatiimit voivat ymmärtää käsittelemänsä datan kontekstin ja rakenteen, mikä johtaa tehokkaampiin näkemyksiin.

4. Ohjelmointirajapinta. Ohjelmointirajapintakerros tarjoaa käyttöliittymän, jota kehittäjät, datatieteilijät ja -analyytikot hyödyntävät datan käyttöä ja käsittelyä varten. Tämä kerros on erittäin tärkeä, sillä se antaa eri sovellusten ja käyttäjien käsitellä dataa ilman taustalla olevan arkkitehtuurin syvällistä teknistä tuntemusta.

5. Kulutus. Kulutuskerros kattaa työkalut ja ympäristöt, jotka antavat jokaiselle käyttäjälle mahdollisuuden analysoida ja visualisoida tietoja. Tämä sisältää liiketoimintatietojen (BI) työkaluja, kuten Power BI:n, sekä datatieteen ja koneoppimisen työkuormia, kuten Fabric Data Sciencen, jotka käyttävät tietovarastoon tallennettua dataa. Kulutuskerros muuntaa raakadatan toiminnallisiksi tiedoiksi, minkä ansiosta koko organisaation sidosryhmät voivat tehdä tietoon perustuvia päätöksiä.

Tietovaraston toteuttaminen

Olitpa siirtämässä tietoja tai perustamassa täysin uutta ratkaisua, tietovaraston toteuttaminen sisältää useita kriittisiä vaiheita. Tässä on vaiheittainen yleiskuva prosessista, mukaan lukien keskeiset huomioitavat asiat:

1. Arvioi toimintaympäristö. Ensin tulee tunnistaa kaikki nykyiset tietolähteet, mukaan lukien tietokannat, sovellukset ja ulkoiset syötteet. Jotta voit ymmärtää tallennusvaatimuksia, luokittele näiden lähteiden data rakenteiseksi, puolirakenteiseksi tai rakenteettomaksi.

2. Määritä vaatimukset ja tavoitteet. Seuraavaksi on tärkeää määritellä selkeästi tavoitteet, mikä auttaa sinua määrittämään tarpeet odotettavissa olevan tietomäärän ja sen kasvun perusteella. Jotta arkaluonteisia tietoja voidaan suojata, tunnista vaatimustenmukaisuuden edellytykset, jotka sinun on täytettävä.

3. Valitse teknologiapino. Valitse pilvi- tai paikallinen tallennusratkaisu, joka tukee tietovarastotarpeitasi. Arvioi sitten tietojenkäsittelyn ja analytiikan vaihtoehdot. Valitse myös työkalut, joita tullaan käyttämään luettelointiin, hallintaan ja tietojen siirtymän seurantaan.

4. Laadi siirtostrategia. Suunnittele siirtostrategiaa kehittäessäsi vaiheittainen siirto aloittaen vähemmän kriittisistä tiedoista häiriöiden minimoimiseksi. Arvioi tietojen laatu, tunnista tarvittavat puhdistus- tai muunnostehtävät ja määritä varmuuskopiostrategiat tietojen eheyden varmistamiseksi.

5. Luo putkia. Kun olet laatinut siirtostrategian, on aika perustaa prosessit erä- ja reaaliaikaisten tietojen käsittelylle ohjelmointirajapintojen avulla. Tietojen käsittelyn sujuvoittamista varten kannattaa harkita myös automaatiotyökalujen, kuten Microsoft Power Automaten, käyttöönottoa manuaalisen puuttumisen vähentämiseksi.

6. Määritä tallennuksen hallinta. Tallennusjärjestelmän määritys kannattaa tehdä kunkin tietotyypin määritellyn rakenteen mukaan. Sinun on myös perustettava metatietojen hallintakäytännöt tietojen löydettävyyden varmistamiseksi ja määritettävä käyttöoikeudet ja turvallisuusprotokollat tietojen suojaamiseksi.

7. Perusta analytiikkakehys. Tässä vaiheessa on hyvä yhdistää liiketoimintatietojen ja analytiikan työkalut, kuten Power BI, raportointia ja visualisointeja varten. Sinun on myös tarjottava kehittäjille tarvittavat kehykset, työkalut ja pääsypisteet koneoppimista ja kehittynyttä analysointia varten.

8. Valvo, optimoi ja toista. Kun olet saanut toteutuksen päätökseen, sinun kannattaa säännöllisesti arvioida suorituskykyä sekä tallennus- ja käsittelykykyä käyttämällä esimerkiksi Fabricin kokonaisvaltaisia seurantatoimintoja. Kannattaa myös perustaa palautejärjestelmä käyttäjille, jotta voit tunnistaa parannus- ja optimointikohteita.

Esimerkkejä tietovarastoista

Maailman huippuorganisaatiot käyttävät tietovarastoarkkitehtuureja tietojen käytön optimointiin, päätöksenteon tehostamiseen ja innovaatioiden edistämiseen toiminnoissa. Tässä on muutamia huomionarvoisia esimerkkejä onnistuneista toteutuksista:

1. Yksi totuuden lähde
Alankomaissa toimiva elintarvikkeiden tukkuyritys Flora Food Group halusi yhdistää useita analytiikkatyökaluja yhdeksi tehokkaaksi alustaksi. Yritys kääntyi Fabricin puoleen raportoinnin, tietojen käsittelyn, datatieteen ja turvallisuuskanavien yhdistämiseksi yhteen ratkaisuun. Yhdistämällä kaikki tietovirrat, yritys pystyi yksinkertaistamaan alusta-arkkitehtuuria, vähentämään kustannuksia ja tarjoamaan asiakkaille entistä tarkempia ja ajankohtaisempia tietoja, mikä paransi palvelun toimitusta ja asiakastyytyväisyyttä.

2. Kehittynyt analysointi ja koneoppiminen
Melbournen lentoaseman, joka on Australian toiseksi vilkkain lentoasema, tuli päivittää tietoanalytiikkatoimintoja operatiivisen tehokkuuden ja matkustajakokemuksen parantamiseksi. Fabricin käyttöönoton avulla organisaatio pystyi yhdistämään tietoja laajasta valikoimasta lähteitä, mukaan lukien pysäköinti, myynti ja lentokentän toimintajärjestelmät, sekä laajentamaan pääsyä tietoon perustuviin näkemyksiin sekä teknisille että ei-teknisille yrityskäyttäjille. Tämän seurauksena lentoasema on saavuttanut 30 prosentin parannuksen suorituskyvyn tehokkuudessa kaikissa tietoon liittyvissä toiminnoissa.

3. Tekoäly ja syväoppiminen
Digitaalisen innovaation yritys Avanade halusi parantaa strategisia päätöksentekoprosessejaan organisaatiossa hyödyntämällä tekoälyteknologioita. Yhdistämällä tietotilansa Fabricin avulla ja kouluttamalla yli 10 000 työntekijää tietoanalytiikassa, Avanade loi käyttäjille perustan tekoälyn helppoon omaksumiseen. Käyttäjät pystyivät hyödyntämään oppimiaan taitoja kehittääkseen räätälöityjä tekoälyratkaisuja, mukaan lukien erilaisia koontinäyttöjä, jotka on kehitetty luonnollisen kielen ja Copilotin avulla Power BI:ssä.

4. Reaaliaikaiset merkitykselliset tiedot
Dener Motorsport, Porsche Carrera Cup Brasilin pääjärjestäjä, sai tehtäväkseen tarjota kattavaa ja ajankohtaista tietoa auton suorituskyvystä ja korjauksista sekä insinööreille että omistajille. Ottamalla käyttöön Fabricin ja sen reaaliaikaisen analytiikan, tallennuksen ja raportoinnin ominaisuudet organisaatio pystyi paremmin tukemaan sidosryhmiä toiminnallisilla, reaaliaikaisilla tiedoilla. Äskettäisessä kilpailussa insinöörit pystyivät jopa tunnistamaan vikaantuvan moottorin Porschen kilpa-autossa, mikä johti auton poistamiseen turvallisuuden vuoksi.

Johtopäätökset

Tietoanalytiikan kehittyvä toimintaympäristö


Tietomäärän eksponentiaalisen kasvun ja reaaliaikaisten tietojen kasvavan kysynnän myötä yhä useammat organisaatiot siirtyvät perinteisistä tietovarastoista joustavampiin ratkaisuihin.

Mahdollistamalla paremman joustavuuden, skaalautuvuuden, operatiivisen tehokkuuden ja yhteistyön datatiimien kesken, data lakehouse -tietovarastot antavat yritysten hyödyntää tietojensa täyttä potentiaalia. Murtamalla siiloja ja tarjoamalla helpomman pääsyn erilaisiin tietotyyppeihin, tietovarastot antavat organisaatioille mahdollisuuden innovoida ja reagoida nopeasti markkinoiden muutoksiin – tämä tekee niistä välttämättömiä nykyaikaisessa tiedonhallinnassa.

Aloita Fabricin maksuton kokeilu

Anna organisaatiollesi mahdollisuus käyttää Microsoft Fabricia, joka on yhtenäinen tiedonhallinta- ja analytiikkaympäristö, joka edistää muutosta ja innovointia tekoälyn aikakaudella.

Aloittaminen on yksinkertaista ja mutkatonta. Et tarvitse Azure-tiliä, vaan voit rekisteröityä suoraan Fabric-ympäristöön.

Lue lisää
Resurssit

Lisäresurssit

Selaa työkaluja, resursseja ja parhaita käytäntöjä, jotka on suunniteltu auttamaan tietovarastoasi menestymään.
Mies, jolla on parta ja silmälasit, kädet nostettuina.
Resurssit

Microsoft Fabricin opastettu esittely

Katso, miten voit käyttää Fabricia kaikkien tietojesi yhdistämiseen ja reaaliaikaiseen analytiikkaan yhdessä käyttöympäristössä.
Mies ja nainen seisovat suuren näytön edessä.
Kumppanit

Microsoft Fabric -kumppanit

Tuo datasi tekoälyn aikakaudelle pätevien Fabric-kumppaneiden asiantuntemuksen avulla.
Lähikuva naisen, jolla on kiharat punaiset hiukset, kasvoista.
Verkkoseminaari

Verkkoseminaarisarja: Johdatus Microsoft Fabriciin

Katso tämä sarja selvittääksesi Microsoft Fabricin, kokonaisvaltaisen analytiikkaratkaisun, keskeiset käyttökokemukset ja hyödyt.

Usein kysytyt kysymykset

  • Toisin kuin perinteiset data warehouse -tietovarastot, jotka käsittelevät pääasiassa rakenteista dataa erittäin järjestelmällisellä tavalla, datalake house -tietovarastot mahdollistavat joustavan tietojen käsittelyn, säilyttämällä eri lähteistä peräisin olevaa rakenteista, puolirakenteista ja rakenteetonta dataa.
  • Tietovaraston dataa voivat käyttää eri sidosryhmät organisaatiossa, mukaan lukien data-analyytikot, datatieteilijät, liiketoimintatiedon asiantuntijat ja päättäjät, merkityksellisten tietojen saamiseksi, tietoon perustuvien päätösten tekemiseksi ja liiketoiminta-arvon luomiseksi.
  • Tietokeskus on keskeinen säilö, joka kokoaa yhteen tietoja eri lähteistä raportointia ja liiketoimintatietoihin liittyviä tarkoituksia varten. Tietovarasto on tätä kattavampi alusta, joka tallentaa rakenteista, puolirakenteista ja rakenteetonta dataa tukeakseen reaaliaikaisia tietoja, koneoppimista ja muita kehittyneen analysoinnin muotoja.
  • Tietovaraston raakadata tallennetaan tyypillisesti alkuperäisessä muodossaan ilman muutoksia tai muunnoksia hajautettuun tiedostojärjestelmään, kuten Apache Hadoopiin. Tämä mahdollistaa suuremman joustavuuden ja skaalautuvuuden erilaisen datan suurten määrien käsittelyssä.

Seuraa Microsoft Fabricia