blockchain အတွက် ခေတ်မီ open source data stack တစ်ခု

1. ခေတ်မီ blockchain ဒေတာစုများအတွက်စိန်ခေါ်မှု

ခေတ်မီ blockchain အညွှန်းကိန်းစတင်ခြင်းတွင် ရင်ဆိုင်ရမည့် စိန်ခေါ်မှုများစွာရှိပါသည်၊၊

  • ဒေတာပမာဏများစွာ။ blockchain ရှိ ဒေတာပမာဏ တိုးလာသည်နှင့်အမျှ၊ တိုးလာသောဝန်ကို ကိုင်တွယ်ရန်နှင့် ဒေတာကို ထိရောက်စွာဝင်ရောက်နိုင်ရန် ဒေတာအညွှန်းကိန်းသည် အတိုင်းအတာအထိ လိုအပ်မည်ဖြစ်သည်။ အကျိုးဆက်အနေဖြင့်၊ ၎င်းသည် သိုလှောင်မှုကုန်ကျစရိတ်ပိုမိုမြင့်မားခြင်း၊ တိုင်းတာမှုနှေးကွေးခြင်းနှင့် ဒေတာဘေ့စ်ဆာဗာတွင် ဝန်တိုးခြင်းတို့ကို ဦးတည်စေသည်။
  • ရှုပ်ထွေးသောဒေတာ စီမံဆောင်ရွက်ပေးသော ပိုက်လိုင်း။ Blockchain နည်းပညာသည် ရှုပ်ထွေးပြီး ပြည့်စုံပြီး ယုံကြည်စိတ်ချရသော ဒေတာအညွှန်းကိန်းတစ်ခု တည်ဆောက်ရာတွင် အရင်းခံဒေတာဖွဲ့စည်းပုံများနှင့် algorithms များကို နက်ရှိုင်းစွာ နားလည်သဘောပေါက်ရန် လိုအပ်ပါသည်။ blockchain အကောင်အထည်ဖော်မှုများ၏ကွဲပြားမှုသည်၎င်းကိုအမွေဆက်ခံသည်။ တိကျသောဥပမာများဖြင့် Ethereum ရှိ NFTs များကို ERC721 နှင့် ERC1155 ဖော်မတ်များနောက်တွင် စမတ်စာချုပ်များအတွင်း ဖန်တီးလေ့ရှိပါသည်။ ဆန့်ကျင်ဘက်အားဖြင့်၊ ဥပမာအားဖြင့်၊ Polkadot ပေါ်ရှိသူတို့၏အကောင်အထည်ဖော်မှုကို blockchain runtime တွင်တိုက်ရိုက်တည်ဆောက်သည်။ အဲဒါတွေကို NFTs အဖြစ် သတ်မှတ်သင့်ပြီး အဲဒါတွေကို သိမ်းဆည်းထားသင့်ပါတယ်။
  • ပေါင်းစည်းနိုင်မှု။ သုံးစွဲသူများအတွက် အမြင့်ဆုံးတန်ဖိုးကို ပေးဆောင်ရန်၊ blockchain အညွှန်းကိန်းဖြေရှင်းချက်တစ်ခုသည် ၎င်း၏ဒေတာအညွှန်းကိန်းကို ခွဲခြမ်းစိတ်ဖြာမှုပလပ်ဖောင်းများ သို့မဟုတ် API များကဲ့သို့သော အခြားစနစ်များနှင့် ပေါင်းစပ်ရန် လိုအပ်ပါသည်။ ၎င်းသည် စိန်ခေါ်မှုဖြစ်ပြီး ဗိသုကာ ဒီဇိုင်းတွင် သိသိသာသာ အားထုတ်မှု လိုအပ်ပါသည်။

blockchain နည်းပညာသည် ပိုမိုကျယ်ပြန့်လာသည်နှင့်အမျှ blockchain တွင် သိမ်းဆည်းထားသော ဒေတာပမာဏ တိုးလာခဲ့သည်။ ဤသည်မှာ နည်းပညာကို လူများ ပိုမိုအသုံးပြုလာခြင်းကြောင့်ဖြစ်ပြီး ငွေပေးငွေယူတစ်ခုစီသည် blockchain သို့ ဒေတာအသစ်များကို ပေါင်းထည့်သောကြောင့်ဖြစ်သည်။ ထို့အပြင်၊ Blockchain နည်းပညာသည် Bitcoin ကိုအသုံးပြုခြင်း နှင့် ပတ်သက်သည့် ရိုးရှင်းသော ငွေလွှဲခြင်း အပလီကေးရှင်းများမှ စမတ် ကန်ထရိုက်များအတွင်း စီးပွားရေးဆိုင်ရာ ယုတ္တိဗေဒ အကောင်အထည်ဖော်မှု ပါ၀င်သည့် ပိုမိုရှုပ်ထွေးသော အပလီကေးရှင်းများအထိ ပြောင်းလဲလာသည်။ ဤစမတ်ကန်ထရိုက်များသည် blockchain ၏ ရှုပ်ထွေးမှုနှင့် အရွယ်အစားကို တိုးမြင့်လာစေပြီး ဒေတာအများအပြားကို ထုတ်ပေးနိုင်သည်။ အချိန်ကြာလာသည်နှင့်အမျှ၊ ၎င်းသည် ပိုမိုကြီးမားပြီး ပိုမိုရှုပ်ထွေးသော blockchain တစ်ခုဆီသို့ ဦးတည်သွားခဲ့သည်။

ဤဆောင်းပါးတွင်၊ ကျွန်ုပ်တို့သည် ကွင်းဆက်ဒေတာ၏စိန်ခေါ်မှုများကို Iceberg-Trino နည်းပညာအစုအဝေးတွင် မည်သို့ကိုင်တွယ်ဖြေရှင်းသည်ကို လေ့လာရန် ဖြစ်ရပ်လေ့လာမှုတစ်ခုအနေဖြင့် Footprint Analytics ၏နည်းပညာဗိသုကာ၏ဆင့်ကဲဖြစ်စဉ်ကို ပြန်လည်သုံးသပ်ပါသည်။

Footprint Analytics သည် အများသူငှာ blockchain ဒေတာ 22 ခုနှင့် NFT စျေးကွက် 17 ခု၊ 1900 GameFi ပရောဂျက်နှင့် NFT စုဆောင်းမှု 100,000 ကျော်တို့ကို အဓိပ္ပါယ်ပြည့်ဝသော စိတ်ကူးစိတ်သန်းဒေတာအလွှာတစ်ခုသို့ အညွှန်းပြုထားသည်။ ၎င်းသည် ကမ္ဘာပေါ်တွင် အပြည့်စုံဆုံး blockchain data warehouse ဖြေရှင်းချက်ဖြစ်သည်။

ဒေတာခွဲခြမ်းစိတ်ဖြာသူများသည် မကြာခဏမေးမြန်းလေ့ရှိသည့် ငွေကြေးလွှဲပြောင်းမှုမှတ်တမ်းများ အတန်းပေါင်း 20 ဘီလီယံကျော်ပါဝင်သည့် blockchain ဒေတာနှင့် မသက်ဆိုင်ပါ။ ၎င်းသည် သမားရိုးကျ ဒေတာသိုလှောင်ရုံများရှိ သွင်းကုန်မှတ်တမ်းများနှင့် ကွဲပြားသည်။

ကြီးထွားလာနေသော လုပ်ငန်းလိုအပ်ချက်များနှင့် ကိုက်ညီရန် လွန်ခဲ့သည့်လများစွာတွင် အကြီးစား အဆင့်မြှင့်တင်မှု 3 ခုကို ကျွန်ုပ်တို့ တွေ့ကြုံခံစားခဲ့ရသည်-

2. ဗိသုကာ 1.0 Bigquery

Footprint Analytics ၏အစတွင်၊ ကျွန်ုပ်တို့အသုံးပြုသည်။ Google Bigquery ကျွန်ုပ်တို့၏ သိုလှောင်မှုနှင့် မေးမြန်းမှုအင်ဂျင်အဖြစ်၊ Bigquery သည် ကောင်းမွန်သော ထုတ်ကုန်တစ်ခုဖြစ်သည်။ ၎င်းသည် အလွန်လျင်မြန်ပြီး၊ အသုံးပြုရလွယ်ကူပြီး သွက်လက်သောဂဏန်းသင်္ချာပါဝါကို ပံ့ပိုးပေးကာ ကျွန်ုပ်တို့ကို အလုပ်အမြန်ပြီးမြောက်စေရန် ကူညီပေးသည့် ပြောင်းလွယ်ပြင်လွယ် UDF အထားအသိုတစ်ခုဖြစ်သည်။

သို့သော်လည်း Bigquery တွင်လည်း ပြဿနာများစွာရှိသည်။

  • အထူးသဖြင့် Footprint Analytics ၏ blockchains 22 ခုကျော်၏ ကုန်ကြမ်းဒေတာကို သိမ်းဆည်းသောအခါတွင် ဒေတာကို ချုံ့မထားသောကြောင့် ကုန်ကျစရိတ်ကြီးမြင့်သည်။
  • မလုံလောက်သော ဆက်စပ်မှု- Bigquery သည် တစ်ပြိုင်နက်တည်း မေးမြန်းချက် 100 ကိုသာ ပံ့ပိုးပေးသည်၊ ၎င်းသည် လေ့လာသူနှင့် အသုံးပြုသူများစွာကို ဝန်ဆောင်မှုပေးသည့်အခါ Footprint ပိုင်းခြားစိတ်ဖြာမှုအတွက် မြင့်မားသော တူညီမှုအခြေအနေများအတွက် မသင့်လျော်ပါ။
  • အရင်းအမြစ်ပိတ်ထုတ်ကုန်ဖြစ်သည့် Google Bigquery ဖြင့် လော့ခ်ချပါ။

ထို့ကြောင့် ကျွန်ုပ်တို့သည် အခြားသော အစားထိုးဗိသုကာများကို ရှာဖွေရန် ဆုံးဖြတ်ခဲ့သည်။

3. ဗိသုကာ 2.0 OLAP

အလွန်ရေပန်းစားလာခဲ့သည့် OLAP ထုတ်ကုန်အချို့ကို ကျွန်ုပ်တို့ အလွန်စိတ်ဝင်စားခဲ့ကြသည်။ OLAP ၏ ဆွဲဆောင်မှုအရှိဆုံး အားသာချက်မှာ ဒေတာအမြောက်အမြားအတွက် query ရလဒ်များကို ပြန်ရရှိရန် စက္ကန့်ခွဲခွဲကြာလေ့ရှိပြီး ၎င်းသည် တစ်ပြိုင်နက်တည်း မေးမြန်းချက်ပေါင်း ထောင်ပေါင်းများစွာကိုလည်း ပံ့ပိုးပေးနိုင်ပါသည်။

ကျွန်ုပ်တို့သည် အကောင်းဆုံး OLAP ဒေတာဘေ့စ်များထဲမှ တစ်ခုကို ရွေးချယ်ခဲ့သည်၊ ဒေါရစ်စမ်းကြည့်ရန်။ ဒီအင်ဂျင်က ကောင်းကောင်းလုပ်ဆောင်တယ်။ သို့သော်၊ တစ်ချိန်ချိန်တွင် ကျွန်ုပ်တို့သည် အခြားပြဿနာများကို ကြုံတွေ့ခဲ့ရသည်-

  • Array သို့မဟုတ် JSON ကဲ့သို့သော ဒေတာအမျိုးအစားများကို မပံ့ပိုးရသေးပါ (နိုဝင်ဘာ၊ 2022)။ Array များသည် blockchains အချို့ရှိ ဘုံဒေတာအမျိုးအစားတစ်ခုဖြစ်သည်။ ဥပမာအားဖြင့်၊ အကြောင်းအရာနယ်ပယ် evm မှတ်တမ်းများတွင် Array တွင် မတွက်ချက်နိုင်ခြင်းသည် ကျွန်ုပ်တို့၏ လုပ်ငန်းမက်ထရစ်များစွာကို တွက်ချက်နိုင်စွမ်းအပေါ် သက်ရောက်မှုရှိပါသည်။
  • DBT အတွက် အကန့်အသတ်ရှိသော ပံ့ပိုးမှု၊ နှင့် ပေါင်းစည်းမှု ထုတ်ပြန်ချက်များအတွက်။ ဤအရာများသည် ကျွန်ုပ်တို့သည် အသစ်ပြင်ဆင်ထားသော အချက်အလက်အချို့ကို အပ်ဒိတ်လုပ်ရန်လိုအပ်သည့် ETL/ELT အခြေအနေများအတွက် ဒေတာအင်ဂျင်နီယာများအတွက် ဘုံလိုအပ်ချက်များဖြစ်သည်။

ထိုသို့ဆိုရလျှင် ကျွန်ုပ်တို့သည် ထုတ်လုပ်မှုဆိုင်ရာ ဒေတာပိုက်လိုင်းတစ်ခုလုံးအတွက် Doris ကို အသုံးမပြုနိုင်ခဲ့သောကြောင့် Doris သည် ဒေတာထုတ်လုပ်မှုပိုက်လိုင်းရှိ ကျွန်ုပ်တို့၏ပြဿနာတစ်စိတ်တစ်ပိုင်းကို ဖြေရှင်းရန်၊ စုံစမ်းမှုအင်ဂျင်အဖြစ် လုပ်ဆောင်ကာ မြန်ဆန်ပြီး မြင့်မားစွာပံ့ပိုးပေးနိုင်ရန် Doris ကို OLAP ဒေတာဘေ့စ်အဖြစ် အသုံးပြုခဲ့သည်။ ပြိုင်တူမေးမြန်းနိုင်မှု။

ကံမကောင်းစွာဖြင့်၊ ကျွန်ုပ်တို့သည် Bigquery ကို Doris နှင့် အစားထိုး၍မရသောကြောင့် ၎င်းကို query engine အဖြစ်အသုံးပြုကာ Bigquery မှ Doris မှ ဒေတာများကို အချိန်အခါအလိုက် ထပ်တူပြုရပါမည်။ ဤထပ်တူပြုခြင်းလုပ်ငန်းစဉ်တွင် ပြဿနာများစွာရှိခဲ့ပြီး တစ်ခုမှာ OLAP အင်ဂျင်သည် ရှေ့ဆုံးဖောက်သည်များထံ စုံစမ်းမေးမြန်းမှုများကို ဆောင်ရွက်ပေးနေချိန်တွင် အပ်ဒိတ်ရေးသားချက်များသည် လျင်မြန်စွာ စုပုံလာခြင်းဖြစ်သည်။ နောက်ပိုင်းတွင် စာရေးခြင်းလုပ်ငန်းစဉ်၏ အရှိန်အဟုန်ကို ထိခိုက်လာကာ ထပ်တူပြုခြင်းသည် အချိန်ပိုကြာကာ တစ်ခါတစ်ရံတွင်ပင် အပြီးသတ်ရန် မဖြစ်နိုင်တော့ပေ။

OLAP သည် ကျွန်ုပ်တို့ကြုံတွေ့နေရသော ပြဿနာများစွာကို ဖြေရှင်းနိုင်ပြီး အထူးသဖြင့် ဒေတာလုပ်ဆောင်ခြင်း ပိုက်လိုင်းအတွက် Footprint Analytics ၏ အချိုးကျဖြေရှင်းချက်ဖြစ်လာမည်မဟုတ်ကြောင်း ကျွန်ုပ်တို့သဘောပေါက်ထားပါသည်။ ကျွန်ုပ်တို့၏ပြဿနာသည် ပိုကြီးပြီး ပိုရှုပ်ထွေးသည်၊ OLAP သည် query engine တစ်ခုတည်းနှင့်မလုံလောက်သောကြောင့် OLAP ကကျွန်ုပ်တို့အတွက်မလုံလောက်ပါ။

4. ဗိသုကာ 3.0 Iceberg + Trino

အရင်းခံဗိသုကာကို အပြီးအပြတ်ပြန်လည်ပြင်ဆင်သည့် Footprint Analytics ဗိသုကာ 3.0 မှကြိုဆိုပါသည်။ ဒေတာသိုလှောင်မှု၊ တွက်ချက်မှုနှင့် စုံစမ်းမေးမြန်းမှုတို့ကို မတူညီသောအပိုင်းသုံးပိုင်းအဖြစ် ပိုင်းခြားရန် မြေပြင်မှ ဗိသုကာတစ်ခုလုံးကို ပြန်လည်ဒီဇိုင်းထုတ်ထားပါသည်။ Footprint Analytics ၏ အစောပိုင်း ဗိသုကာလက်ရာနှစ်ခုမှ သင်ခန်းစာယူပြီး Uber၊ Netflix နှင့် Databricks ကဲ့သို့သော အခြားအောင်မြင်သော ဒေတာပရောဂျက်ကြီးများ၏ အတွေ့အကြုံများမှ သင်ယူခြင်း။

၄.၁။ ဒေအိုင်နိဒါန်း

ဖွဲ့စည်းတည်ဆောက်ပုံနှင့်ဖွဲ့စည်းပုံမထားသောဒေတာနှစ်မျိုးလုံးအတွက် ဒေတာသိုလှောင်မှုအမျိုးအစားအသစ်ဖြစ်သော data lake ကို ဦးစွာအာရုံစိုက်ခဲ့ပါသည်။ Data lake သည် On-chain data range ၏ formats များဖြစ်ပြီး ကျယ်ပြန့်စွာဖွဲ့စည်းပုံမထားသော raw data မှ structured abstraction data သို့ Footprint Analytics သည် လူသိများသည်။ ဒေတာသိုလှောင်မှုပြဿနာကိုဖြေရှင်းရန် data lake ကိုအသုံးပြုရန်မျှော်လင့်ထားပြီး Footprint Analytics သည်ပြောင်းလဲလာသည်နှင့်အမျှ ၎င်းသည် အဓိကကျသောတွက်ချက်မှုအင်ဂျင်များဖြစ်သော Spark နှင့် Flink တို့ကိုလည်းပံ့ပိုးပေးမည်ဖြစ်သည်၊ ထို့ကြောင့် Footprint Analytics သည် ပြောင်းလဲလာသည်နှင့်အမျှ ၎င်းသည် မတူညီသောလုပ်ဆောင်မှုအင်ဂျင်များနှင့်ပေါင်းစပ်ရန် နာကျင်မှုမရှိစေရပါ။ .

Iceberg သည် Spark၊ Flink၊ Trino နှင့် အခြားသော ကွန်ပြူတာအင်ဂျင်များနှင့် အလွန်ကောင်းမွန်စွာ ပေါင်းစပ်ထားပြီး ကျွန်ုပ်တို့၏ တိုင်းတာမှုတစ်ခုစီအတွက် အသင့်လျော်ဆုံးတွက်ချက်မှုကို ကျွန်ုပ်တို့ ရွေးချယ်နိုင်ပါသည်။ ဥပမာ:

  • ရှုပ်ထွေးသော တွက်ချက်မှုဆိုင်ရာ ယုတ္တိဗေဒ လိုအပ်သူများအတွက် Spark သည် ရွေးချယ်မှုဖြစ်လိမ့်မည်။
  • အချိန်နှင့်တပြေးညီတွက်ချက်မှုအတွက် Flink ။
  • SQL ကို အသုံးပြု၍ လုပ်ဆောင်နိုင်သော ရိုးရှင်းသော ETL အလုပ်များအတွက်၊ ကျွန်ုပ်တို့သည် Trino ကို အသုံးပြုပါသည်။

၄.၂။ မေးခွန်းအင်ဂျင်

Iceberg သည် သိုလှောင်မှုနှင့် တွက်ချက်မှုဆိုင်ရာ ပြဿနာများကို ဖြေရှင်းပေးခြင်းဖြင့်၊ query engine တစ်ခုကို ရွေးချယ်ရန် စဉ်းစားနေခဲ့ရသည်။ ရနိုင်သောရွေးချယ်စရာများစွာမရှိပါ။ ကျွန်ုပ်တို့ စဉ်းစားထားသော အခြားရွေးချယ်စရာများ

နက်နဲစွာမလေ့လာမီ အရေးကြီးဆုံးအချက်မှာ အနာဂတ် query engine သည် ကျွန်ုပ်တို့၏ လက်ရှိတည်ဆောက်ပုံနှင့် သဟဇာတဖြစ်ရန် လိုအပ်ပါသည်။

  • Bigquery ကို ဒေတာအရင်းအမြစ်အဖြစ် ပံ့ပိုးရန်
  • တိုင်းတာမှုများစွာကို ထုတ်လုပ်ရန်အတွက် ကျွန်ုပ်တို့အားကိုးသည့် DBT ကို ပံ့ပိုးရန်
  • BI tool metabase ကိုပံ့ပိုးရန်

အထက်ဖော်ပြပါအချက်များအပေါ် အခြေခံ၍ Iceberg အတွက် အလွန်ကောင်းမွန်သော ပံ့ပိုးကူညီမှုရှိသော Trino ကို ရွေးချယ်ခဲ့ပြီး အဖွဲ့သည် တုံ့ပြန်မှုအလွန်ကောင်းမွန်သောကြောင့် bug တစ်ခုကို နောက်ရက်တွင် ပြင်ဆင်ပြီး နောက်အပတ်တွင် နောက်ဆုံးဗားရှင်းသို့ ဖြန့်ချိခဲ့သည်။ ၎င်းသည် မြင့်မားသောအကောင်အထည်ဖော်မှုတုံ့ပြန်မှုလိုအပ်သော Footprint အဖွဲ့အတွက် အကောင်းဆုံးရွေးချယ်မှုဖြစ်သည်။

၄.၃။ စွမ်းဆောင်ရည်စမ်းသပ်ခြင်း။

ကျွန်ုပ်တို့၏ ဦးတည်ချက်ကို ဆုံးဖြတ်ပြီးသည်နှင့် ကျွန်ုပ်တို့သည် ကျွန်ုပ်တို့၏လိုအပ်ချက်များကို ဖြည့်ဆည်းပေးနိုင်ပြီး ကျွန်ုပ်တို့၏ အံ့အားသင့်စရာဖြစ်နိုင်ချေရှိမရှိ သိနိုင်ရန် Trino + Iceberg ပေါင်းစပ်မှုတွင် စွမ်းဆောင်ရည်စမ်းသပ်မှုတစ်ခု ပြုလုပ်ခဲ့ပါသည်။

Presto + Hive သည် OLAP ဖောင်းပွမှုအားလုံးတွင် နှစ်အတော်ကြာ အဆိုးဆုံး နှိုင်းယှဥ်ပြနေမှန်း သိသဖြင့် Trino + Iceberg ပေါင်းစပ်မှုက ကျွန်ုပ်တို့၏စိတ်ကို လုံးလုံးလျားလျား ထိခိုက်စေခဲ့သည်။

ဤသည်မှာ ကျွန်ုပ်တို့၏ စမ်းသပ်မှုရလဒ်များဖြစ်သည်။

case 1- ကြီးမားသောဒေတာအတွဲကို ချိတ်ဆက်ပါ။

800 GB table1 သည် အခြား 50 GB table2 နှင့် ချိတ်ဆက်ပြီး ရှုပ်ထွေးသော လုပ်ငန်းဆိုင်ရာ တွက်ချက်မှုများကို လုပ်ဆောင်သည်။

case2- ကွဲပြားသောမေးမြန်းချက်တစ်ခုပြုလုပ်ရန် ကြီးမားသောဇယားတစ်ခုကို အသုံးပြုပါ။

စမ်းသပ် sql- နေ့အလိုက် ဇယားအုပ်စုမှ ကွဲပြားသော(လိပ်စာ)ကို ရွေးပါ။

Trino+Iceberg ပေါင်းစပ်မှုသည် တူညီသောဖွဲ့စည်းပုံတွင် Doris ထက် ၃ ဆခန့် ပိုမြန်သည်။

ထို့အပြင်၊ Iceberg သည် ဒေတာကို ချုံ့ပြီး သိမ်းဆည်းပေးမည့် Parquet၊ ORC စသည်တို့ကဲ့သို့ ဒေတာဖော်မတ်များကို သုံးနိုင်သောကြောင့် နောက်ထပ် အံ့သြစရာတစ်ခုရှိပါသည်။ Iceberg ၏ စားပွဲတင်သိုလှောင်မှုသည် အခြားဒေတာဂိုဒေါင်များ၏ နေရာလွတ်၏ 1/5 ခန့်သာ ယူသည်။ ဒေတာဘေ့စ်သုံးခုရှိ ဇယားတစ်ခုတည်း၏ သိုလှောင်မှုအရွယ်အစားမှာ အောက်ပါအတိုင်းဖြစ်သည်။

မှတ်ချက်- အထက်ဖော်ပြပါ စမ်းသပ်မှုများသည် အမှန်တကယ် ထုတ်လုပ်ရေးတွင် ကျွန်ုပ်တို့ကြုံတွေ့ခဲ့ရသည့် ဥပမာများဖြစ်ပြီး ကိုးကားရန်အတွက်သာ ဖြစ်သည်။

၄.၄။ အကျိုးသက်ရောက်မှုကို အဆင့်မြှင့်ပါ။

စွမ်းဆောင်ရည်စမ်းသပ်မှုအစီရင်ခံစာများသည် ကျွန်ုပ်တို့၏အဖွဲ့အား ပြောင်းရွှေ့ခြင်းပြီးမြောက်ရန် 2 လခန့် အချိန်ယူခဲ့ရကြောင်းနှင့် ၎င်းသည် အဆင့်မြှင့်ပြီးနောက် ကျွန်ုပ်တို့၏ဗိသုကာလက်ရာ၏ ပုံကြမ်းဖြစ်သည်။

  • ကွန်ပြူတာအင်ဂျင်များစွာသည် ကျွန်ုပ်တို့၏လိုအပ်ချက်အမျိုးမျိုးကို လိုက်ဖက်ပါသည်။
  • Trino သည် DBT ကို ပံ့ပိုးထားပြီး Iceberg ကို တိုက်ရိုက်မေးမြန်းနိုင်သောကြောင့် ကျွန်ုပ်တို့သည် ဒေတာထပ်တူပြုခြင်းကို ကိုင်တွယ်ဖြေရှင်းရန် မလိုအပ်တော့ပါ။
  • Trino + Iceberg ၏အံ့သြဖွယ်စွမ်းဆောင်ရည်သည် ကျွန်ုပ်တို့၏အသုံးပြုသူများအတွက် Bronze data (ကုန်ကြမ်းဒေတာ) အားလုံးကို ဖွင့်နိုင်စေပါသည်။

5 ။ အကျဉ်းချုပ်

2021 ခုနှစ်သြဂုတ်လတွင်စတင်မိတ်ဆက်ခဲ့ပြီးကတည်းက Footprint Analytics အဖွဲ့သည် တစ်နှစ်ခွဲအတွင်း ဗိသုကာမွမ်းမံပြင်ဆင်မှု XNUMX ခုကို ပြီးမြောက်ခဲ့ပြီး၊ ၎င်း၏ခိုင်မာသောဆန္ဒနှင့် ၎င်း၏အကောင်းဆုံးဒေတာဘေ့စ်နည်းပညာ၏အကျိုးကျေးဇူးများကို ၎င်း၏ crypto အသုံးပြုသူများထံ ယူဆောင်လာရန်နှင့် အကောင်အထည်ဖော်ရာတွင် ခိုင်မာသော ကတိကဝတ်များကို ဆောင်ကြဉ်းပေးရန်အတွက် ပြင်းပြသောဆန္ဒနှင့် ဆုံးဖြတ်ချက်ကြောင့်၊ ၎င်း၏အခြေခံအဆောက်အအုံနှင့် ဗိသုကာပညာကို အဆင့်မြှင့်တင်ခြင်း။

Footprint Analytics ဗိသုကာ အဆင့်မြှင့်တင်မှု 3.0 သည် ၎င်း၏အသုံးပြုသူများအတွက် အတွေ့အကြုံအသစ်တစ်ခုကို ဝယ်ယူခဲ့ပြီး နောက်ခံအမျိုးမျိုးမှ အသုံးပြုသူများအား ပိုမိုကွဲပြားသောအသုံးပြုမှုနှင့် အပလီကေးရှင်းများတွင် ထိုးထွင်းသိမြင်မှုရရှိစေသည်-

  • Metabase BI ကိရိယာဖြင့်တည်ဆောက်ထားသော Footprint သည် ခွဲခြမ်းစိတ်ဖြာသူအား ကုဒ်လုပ်ထားသော ကွင်းဆက်ဒေတာကို ဝင်ရောက်ကြည့်ရှုခွင့်ရရန်၊ စူးစမ်းလေ့လာရန်၊ လွတ်လပ်စွာရွေးချယ်ခွင့်အပြည့်ရှိသောကိရိယာများ (no-code သို့မဟုတ် hardcord)၊ မှတ်တမ်းတစ်ခုလုံးကို စုံစမ်းမေးမြန်းရန်နှင့် ဒေတာအတွဲများကို ထဲထဲဝင်ဝင်ဝင်ရောက်ကြည့်ရှုနိုင်ရန်၊ အချိန်မရှိ။
  • web2 + web3 တစ်လျှောက် ခွဲခြမ်းစိတ်ဖြာရန်အတွက် ကွင်းဆက်နှင့် ကွင်းဆက်ဒေတာ နှစ်ခုလုံးကို ပေါင်းစပ်ပါ။
  • Footprint ၏ စီးပွားရေးဆိုင်ရာ စိတ်ကူးစိတ်သန်းများ၏ထိပ်တွင် တည်ဆောက်ခြင်း/မေးမြန်းခြင်း မက်ထရစ်များကို တည်ဆောက်ခြင်းဖြင့်၊ လေ့လာဆန်းစစ်သူများ သို့မဟုတ် ဆော့ဖ်ဝဲအင်ဂျင်နီယာများသည် ထပ်တလဲလဲဒေတာလုပ်ဆောင်ခြင်းလုပ်ငန်း၏ 80% အတွက် အချိန်ကုန်သက်သာစေပြီး ၎င်းတို့၏လုပ်ငန်းအပေါ်အခြေခံ၍ အဓိပ္ပာယ်ရှိသော မက်ထရစ်များ၊ သုတေသနနှင့် ထုတ်ကုန်ဖြေရှင်းချက်များကို အာရုံစိုက်ပါ။
  • SQL ကိုအခြေခံ၍ Footprint ဝဘ်မှ REST API ခေါ်ဆိုမှုများအထိ ချောမွေ့မှုမရှိသော အတွေ့အကြုံ
  • ရင်းနှီးမြှုပ်နှံမှုဆိုင်ရာ ဆုံးဖြတ်ချက်များကို ပံ့ပိုးရန် အဓိကအချက်ပြမှုများတွင် အချိန်နှင့်တပြေးညီ သတိပေးချက်များနှင့် လုပ်ဆောင်နိုင်သော သတိပေးချက်များ

အရင်းအမြစ်- https://cryptoslate.com/iceberg-spark-trino-a-modern-open-source-data-stack-for-blockchain/