1. ခေတ်မီ blockchain ဒေတာစုများအတွက်စိန်ခေါ်မှု
ခေတ်မီ blockchain အညွှန်းကိန်းစတင်ခြင်းတွင် ရင်ဆိုင်ရမည့် စိန်ခေါ်မှုများစွာရှိပါသည်၊၊
- ဒေတာပမာဏများစွာ။ blockchain ရှိ ဒေတာပမာဏ တိုးလာသည်နှင့်အမျှ၊ တိုးလာသောဝန်ကို ကိုင်တွယ်ရန်နှင့် ဒေတာကို ထိရောက်စွာဝင်ရောက်နိုင်ရန် ဒေတာအညွှန်းကိန်းသည် အတိုင်းအတာအထိ လိုအပ်မည်ဖြစ်သည်။ အကျိုးဆက်အနေဖြင့်၊ ၎င်းသည် သိုလှောင်မှုကုန်ကျစရိတ်ပိုမိုမြင့်မားခြင်း၊ တိုင်းတာမှုနှေးကွေးခြင်းနှင့် ဒေတာဘေ့စ်ဆာဗာတွင် ဝန်တိုးခြင်းတို့ကို ဦးတည်စေသည်။
- ရှုပ်ထွေးသောဒေတာ စီမံဆောင်ရွက်ပေးသော ပိုက်လိုင်း။ Blockchain နည်းပညာသည် ရှုပ်ထွေးပြီး ပြည့်စုံပြီး ယုံကြည်စိတ်ချရသော ဒေတာအညွှန်းကိန်းတစ်ခု တည်ဆောက်ရာတွင် အရင်းခံဒေတာဖွဲ့စည်းပုံများနှင့် algorithms များကို နက်ရှိုင်းစွာ နားလည်သဘောပေါက်ရန် လိုအပ်ပါသည်။ blockchain အကောင်အထည်ဖော်မှုများ၏ကွဲပြားမှုသည်၎င်းကိုအမွေဆက်ခံသည်။ တိကျသောဥပမာများဖြင့် Ethereum ရှိ NFTs များကို ERC721 နှင့် ERC1155 ဖော်မတ်များနောက်တွင် စမတ်စာချုပ်များအတွင်း ဖန်တီးလေ့ရှိပါသည်။ ဆန့်ကျင်ဘက်အားဖြင့်၊ ဥပမာအားဖြင့်၊ Polkadot ပေါ်ရှိသူတို့၏အကောင်အထည်ဖော်မှုကို blockchain runtime တွင်တိုက်ရိုက်တည်ဆောက်သည်။ အဲဒါတွေကို NFTs အဖြစ် သတ်မှတ်သင့်ပြီး အဲဒါတွေကို သိမ်းဆည်းထားသင့်ပါတယ်။
- ပေါင်းစည်းနိုင်မှု။ သုံးစွဲသူများအတွက် အမြင့်ဆုံးတန်ဖိုးကို ပေးဆောင်ရန်၊ blockchain အညွှန်းကိန်းဖြေရှင်းချက်တစ်ခုသည် ၎င်း၏ဒေတာအညွှန်းကိန်းကို ခွဲခြမ်းစိတ်ဖြာမှုပလပ်ဖောင်းများ သို့မဟုတ် API များကဲ့သို့သော အခြားစနစ်များနှင့် ပေါင်းစပ်ရန် လိုအပ်ပါသည်။ ၎င်းသည် စိန်ခေါ်မှုဖြစ်ပြီး ဗိသုကာ ဒီဇိုင်းတွင် သိသိသာသာ အားထုတ်မှု လိုအပ်ပါသည်။
blockchain နည်းပညာသည် ပိုမိုကျယ်ပြန့်လာသည်နှင့်အမျှ blockchain တွင် သိမ်းဆည်းထားသော ဒေတာပမာဏ တိုးလာခဲ့သည်။ ဤသည်မှာ နည်းပညာကို လူများ ပိုမိုအသုံးပြုလာခြင်းကြောင့်ဖြစ်ပြီး ငွေပေးငွေယူတစ်ခုစီသည် blockchain သို့ ဒေတာအသစ်များကို ပေါင်းထည့်သောကြောင့်ဖြစ်သည်။ ထို့အပြင်၊ Blockchain နည်းပညာသည် Bitcoin ကိုအသုံးပြုခြင်း နှင့် ပတ်သက်သည့် ရိုးရှင်းသော ငွေလွှဲခြင်း အပလီကေးရှင်းများမှ စမတ် ကန်ထရိုက်များအတွင်း စီးပွားရေးဆိုင်ရာ ယုတ္တိဗေဒ အကောင်အထည်ဖော်မှု ပါ၀င်သည့် ပိုမိုရှုပ်ထွေးသော အပလီကေးရှင်းများအထိ ပြောင်းလဲလာသည်။ ဤစမတ်ကန်ထရိုက်များသည် blockchain ၏ ရှုပ်ထွေးမှုနှင့် အရွယ်အစားကို တိုးမြင့်လာစေပြီး ဒေတာအများအပြားကို ထုတ်ပေးနိုင်သည်။ အချိန်ကြာလာသည်နှင့်အမျှ၊ ၎င်းသည် ပိုမိုကြီးမားပြီး ပိုမိုရှုပ်ထွေးသော blockchain တစ်ခုဆီသို့ ဦးတည်သွားခဲ့သည်။
ဤဆောင်းပါးတွင်၊ ကျွန်ုပ်တို့သည် ကွင်းဆက်ဒေတာ၏စိန်ခေါ်မှုများကို Iceberg-Trino နည်းပညာအစုအဝေးတွင် မည်သို့ကိုင်တွယ်ဖြေရှင်းသည်ကို လေ့လာရန် ဖြစ်ရပ်လေ့လာမှုတစ်ခုအနေဖြင့် Footprint Analytics ၏နည်းပညာဗိသုကာ၏ဆင့်ကဲဖြစ်စဉ်ကို ပြန်လည်သုံးသပ်ပါသည်။
Footprint Analytics သည် အများသူငှာ blockchain ဒေတာ 22 ခုနှင့် NFT စျေးကွက် 17 ခု၊ 1900 GameFi ပရောဂျက်နှင့် NFT စုဆောင်းမှု 100,000 ကျော်တို့ကို အဓိပ္ပါယ်ပြည့်ဝသော စိတ်ကူးစိတ်သန်းဒေတာအလွှာတစ်ခုသို့ အညွှန်းပြုထားသည်။ ၎င်းသည် ကမ္ဘာပေါ်တွင် အပြည့်စုံဆုံး blockchain data warehouse ဖြေရှင်းချက်ဖြစ်သည်။
ဒေတာခွဲခြမ်းစိတ်ဖြာသူများသည် မကြာခဏမေးမြန်းလေ့ရှိသည့် ငွေကြေးလွှဲပြောင်းမှုမှတ်တမ်းများ အတန်းပေါင်း 20 ဘီလီယံကျော်ပါဝင်သည့် blockchain ဒေတာနှင့် မသက်ဆိုင်ပါ။ ၎င်းသည် သမားရိုးကျ ဒေတာသိုလှောင်ရုံများရှိ သွင်းကုန်မှတ်တမ်းများနှင့် ကွဲပြားသည်။
ကြီးထွားလာနေသော လုပ်ငန်းလိုအပ်ချက်များနှင့် ကိုက်ညီရန် လွန်ခဲ့သည့်လများစွာတွင် အကြီးစား အဆင့်မြှင့်တင်မှု 3 ခုကို ကျွန်ုပ်တို့ တွေ့ကြုံခံစားခဲ့ရသည်-
2. ဗိသုကာ 1.0 Bigquery
Footprint Analytics ၏အစတွင်၊ ကျွန်ုပ်တို့အသုံးပြုသည်။ Google Bigquery ကျွန်ုပ်တို့၏ သိုလှောင်မှုနှင့် မေးမြန်းမှုအင်ဂျင်အဖြစ်၊ Bigquery သည် ကောင်းမွန်သော ထုတ်ကုန်တစ်ခုဖြစ်သည်။ ၎င်းသည် အလွန်လျင်မြန်ပြီး၊ အသုံးပြုရလွယ်ကူပြီး သွက်လက်သောဂဏန်းသင်္ချာပါဝါကို ပံ့ပိုးပေးကာ ကျွန်ုပ်တို့ကို အလုပ်အမြန်ပြီးမြောက်စေရန် ကူညီပေးသည့် ပြောင်းလွယ်ပြင်လွယ် UDF အထားအသိုတစ်ခုဖြစ်သည်။
သို့သော်လည်း Bigquery တွင်လည်း ပြဿနာများစွာရှိသည်။
- အထူးသဖြင့် Footprint Analytics ၏ blockchains 22 ခုကျော်၏ ကုန်ကြမ်းဒေတာကို သိမ်းဆည်းသောအခါတွင် ဒေတာကို ချုံ့မထားသောကြောင့် ကုန်ကျစရိတ်ကြီးမြင့်သည်။
- မလုံလောက်သော ဆက်စပ်မှု- Bigquery သည် တစ်ပြိုင်နက်တည်း မေးမြန်းချက် 100 ကိုသာ ပံ့ပိုးပေးသည်၊ ၎င်းသည် လေ့လာသူနှင့် အသုံးပြုသူများစွာကို ဝန်ဆောင်မှုပေးသည့်အခါ Footprint ပိုင်းခြားစိတ်ဖြာမှုအတွက် မြင့်မားသော တူညီမှုအခြေအနေများအတွက် မသင့်လျော်ပါ။
- အရင်းအမြစ်ပိတ်ထုတ်ကုန်ဖြစ်သည့် Google Bigquery ဖြင့် လော့ခ်ချပါ။
ထို့ကြောင့် ကျွန်ုပ်တို့သည် အခြားသော အစားထိုးဗိသုကာများကို ရှာဖွေရန် ဆုံးဖြတ်ခဲ့သည်။
3. ဗိသုကာ 2.0 OLAP
အလွန်ရေပန်းစားလာခဲ့သည့် OLAP ထုတ်ကုန်အချို့ကို ကျွန်ုပ်တို့ အလွန်စိတ်ဝင်စားခဲ့ကြသည်။ OLAP ၏ ဆွဲဆောင်မှုအရှိဆုံး အားသာချက်မှာ ဒေတာအမြောက်အမြားအတွက် query ရလဒ်များကို ပြန်ရရှိရန် စက္ကန့်ခွဲခွဲကြာလေ့ရှိပြီး ၎င်းသည် တစ်ပြိုင်နက်တည်း မေးမြန်းချက်ပေါင်း ထောင်ပေါင်းများစွာကိုလည်း ပံ့ပိုးပေးနိုင်ပါသည်။
ကျွန်ုပ်တို့သည် အကောင်းဆုံး OLAP ဒေတာဘေ့စ်များထဲမှ တစ်ခုကို ရွေးချယ်ခဲ့သည်၊ ဒေါရစ်စမ်းကြည့်ရန်။ ဒီအင်ဂျင်က ကောင်းကောင်းလုပ်ဆောင်တယ်။ သို့သော်၊ တစ်ချိန်ချိန်တွင် ကျွန်ုပ်တို့သည် အခြားပြဿနာများကို ကြုံတွေ့ခဲ့ရသည်-
- Array သို့မဟုတ် JSON ကဲ့သို့သော ဒေတာအမျိုးအစားများကို မပံ့ပိုးရသေးပါ (နိုဝင်ဘာ၊ 2022)။ Array များသည် blockchains အချို့ရှိ ဘုံဒေတာအမျိုးအစားတစ်ခုဖြစ်သည်။ ဥပမာအားဖြင့်၊ အကြောင်းအရာနယ်ပယ် evm မှတ်တမ်းများတွင် Array တွင် မတွက်ချက်နိုင်ခြင်းသည် ကျွန်ုပ်တို့၏ လုပ်ငန်းမက်ထရစ်များစွာကို တွက်ချက်နိုင်စွမ်းအပေါ် သက်ရောက်မှုရှိပါသည်။
- DBT အတွက် အကန့်အသတ်ရှိသော ပံ့ပိုးမှု၊ နှင့် ပေါင်းစည်းမှု ထုတ်ပြန်ချက်များအတွက်။ ဤအရာများသည် ကျွန်ုပ်တို့သည် အသစ်ပြင်ဆင်ထားသော အချက်အလက်အချို့ကို အပ်ဒိတ်လုပ်ရန်လိုအပ်သည့် ETL/ELT အခြေအနေများအတွက် ဒေတာအင်ဂျင်နီယာများအတွက် ဘုံလိုအပ်ချက်များဖြစ်သည်။
ထိုသို့ဆိုရလျှင် ကျွန်ုပ်တို့သည် ထုတ်လုပ်မှုဆိုင်ရာ ဒေတာပိုက်လိုင်းတစ်ခုလုံးအတွက် Doris ကို အသုံးမပြုနိုင်ခဲ့သောကြောင့် Doris သည် ဒေတာထုတ်လုပ်မှုပိုက်လိုင်းရှိ ကျွန်ုပ်တို့၏ပြဿနာတစ်စိတ်တစ်ပိုင်းကို ဖြေရှင်းရန်၊ စုံစမ်းမှုအင်ဂျင်အဖြစ် လုပ်ဆောင်ကာ မြန်ဆန်ပြီး မြင့်မားစွာပံ့ပိုးပေးနိုင်ရန် Doris ကို OLAP ဒေတာဘေ့စ်အဖြစ် အသုံးပြုခဲ့သည်။ ပြိုင်တူမေးမြန်းနိုင်မှု။
ကံမကောင်းစွာဖြင့်၊ ကျွန်ုပ်တို့သည် Bigquery ကို Doris နှင့် အစားထိုး၍မရသောကြောင့် ၎င်းကို query engine အဖြစ်အသုံးပြုကာ Bigquery မှ Doris မှ ဒေတာများကို အချိန်အခါအလိုက် ထပ်တူပြုရပါမည်။ ဤထပ်တူပြုခြင်းလုပ်ငန်းစဉ်တွင် ပြဿနာများစွာရှိခဲ့ပြီး တစ်ခုမှာ OLAP အင်ဂျင်သည် ရှေ့ဆုံးဖောက်သည်များထံ စုံစမ်းမေးမြန်းမှုများကို ဆောင်ရွက်ပေးနေချိန်တွင် အပ်ဒိတ်ရေးသားချက်များသည် လျင်မြန်စွာ စုပုံလာခြင်းဖြစ်သည်။ နောက်ပိုင်းတွင် စာရေးခြင်းလုပ်ငန်းစဉ်၏ အရှိန်အဟုန်ကို ထိခိုက်လာကာ ထပ်တူပြုခြင်းသည် အချိန်ပိုကြာကာ တစ်ခါတစ်ရံတွင်ပင် အပြီးသတ်ရန် မဖြစ်နိုင်တော့ပေ။
OLAP သည် ကျွန်ုပ်တို့ကြုံတွေ့နေရသော ပြဿနာများစွာကို ဖြေရှင်းနိုင်ပြီး အထူးသဖြင့် ဒေတာလုပ်ဆောင်ခြင်း ပိုက်လိုင်းအတွက် Footprint Analytics ၏ အချိုးကျဖြေရှင်းချက်ဖြစ်လာမည်မဟုတ်ကြောင်း ကျွန်ုပ်တို့သဘောပေါက်ထားပါသည်။ ကျွန်ုပ်တို့၏ပြဿနာသည် ပိုကြီးပြီး ပိုရှုပ်ထွေးသည်၊ OLAP သည် query engine တစ်ခုတည်းနှင့်မလုံလောက်သောကြောင့် OLAP ကကျွန်ုပ်တို့အတွက်မလုံလောက်ပါ။
4. ဗိသုကာ 3.0 Iceberg + Trino
အရင်းခံဗိသုကာကို အပြီးအပြတ်ပြန်လည်ပြင်ဆင်သည့် Footprint Analytics ဗိသုကာ 3.0 မှကြိုဆိုပါသည်။ ဒေတာသိုလှောင်မှု၊ တွက်ချက်မှုနှင့် စုံစမ်းမေးမြန်းမှုတို့ကို မတူညီသောအပိုင်းသုံးပိုင်းအဖြစ် ပိုင်းခြားရန် မြေပြင်မှ ဗိသုကာတစ်ခုလုံးကို ပြန်လည်ဒီဇိုင်းထုတ်ထားပါသည်။ Footprint Analytics ၏ အစောပိုင်း ဗိသုကာလက်ရာနှစ်ခုမှ သင်ခန်းစာယူပြီး Uber၊ Netflix နှင့် Databricks ကဲ့သို့သော အခြားအောင်မြင်သော ဒေတာပရောဂျက်ကြီးများ၏ အတွေ့အကြုံများမှ သင်ယူခြင်း။
၄.၁။ ဒေအိုင်နိဒါန်း
ဖွဲ့စည်းတည်ဆောက်ပုံနှင့်ဖွဲ့စည်းပုံမထားသောဒေတာနှစ်မျိုးလုံးအတွက် ဒေတာသိုလှောင်မှုအမျိုးအစားအသစ်ဖြစ်သော data lake ကို ဦးစွာအာရုံစိုက်ခဲ့ပါသည်။ Data lake သည် On-chain data range ၏ formats များဖြစ်ပြီး ကျယ်ပြန့်စွာဖွဲ့စည်းပုံမထားသော raw data မှ structured abstraction data သို့ Footprint Analytics သည် လူသိများသည်။ ဒေတာသိုလှောင်မှုပြဿနာကိုဖြေရှင်းရန် data lake ကိုအသုံးပြုရန်မျှော်လင့်ထားပြီး Footprint Analytics သည်ပြောင်းလဲလာသည်နှင့်အမျှ ၎င်းသည် အဓိကကျသောတွက်ချက်မှုအင်ဂျင်များဖြစ်သော Spark နှင့် Flink တို့ကိုလည်းပံ့ပိုးပေးမည်ဖြစ်သည်၊ ထို့ကြောင့် Footprint Analytics သည် ပြောင်းလဲလာသည်နှင့်အမျှ ၎င်းသည် မတူညီသောလုပ်ဆောင်မှုအင်ဂျင်များနှင့်ပေါင်းစပ်ရန် နာကျင်မှုမရှိစေရပါ။ .
Iceberg သည် Spark၊ Flink၊ Trino နှင့် အခြားသော ကွန်ပြူတာအင်ဂျင်များနှင့် အလွန်ကောင်းမွန်စွာ ပေါင်းစပ်ထားပြီး ကျွန်ုပ်တို့၏ တိုင်းတာမှုတစ်ခုစီအတွက် အသင့်လျော်ဆုံးတွက်ချက်မှုကို ကျွန်ုပ်တို့ ရွေးချယ်နိုင်ပါသည်။ ဥပမာ:
- ရှုပ်ထွေးသော တွက်ချက်မှုဆိုင်ရာ ယုတ္တိဗေဒ လိုအပ်သူများအတွက် Spark သည် ရွေးချယ်မှုဖြစ်လိမ့်မည်။
- အချိန်နှင့်တပြေးညီတွက်ချက်မှုအတွက် Flink ။
- SQL ကို အသုံးပြု၍ လုပ်ဆောင်နိုင်သော ရိုးရှင်းသော ETL အလုပ်များအတွက်၊ ကျွန်ုပ်တို့သည် Trino ကို အသုံးပြုပါသည်။
၄.၂။ မေးခွန်းအင်ဂျင်
Iceberg သည် သိုလှောင်မှုနှင့် တွက်ချက်မှုဆိုင်ရာ ပြဿနာများကို ဖြေရှင်းပေးခြင်းဖြင့်၊ query engine တစ်ခုကို ရွေးချယ်ရန် စဉ်းစားနေခဲ့ရသည်။ ရနိုင်သောရွေးချယ်စရာများစွာမရှိပါ။ ကျွန်ုပ်တို့ စဉ်းစားထားသော အခြားရွေးချယ်စရာများ
နက်နဲစွာမလေ့လာမီ အရေးကြီးဆုံးအချက်မှာ အနာဂတ် query engine သည် ကျွန်ုပ်တို့၏ လက်ရှိတည်ဆောက်ပုံနှင့် သဟဇာတဖြစ်ရန် လိုအပ်ပါသည်။
- Bigquery ကို ဒေတာအရင်းအမြစ်အဖြစ် ပံ့ပိုးရန်
- တိုင်းတာမှုများစွာကို ထုတ်လုပ်ရန်အတွက် ကျွန်ုပ်တို့အားကိုးသည့် DBT ကို ပံ့ပိုးရန်
- BI tool metabase ကိုပံ့ပိုးရန်
အထက်ဖော်ပြပါအချက်များအပေါ် အခြေခံ၍ Iceberg အတွက် အလွန်ကောင်းမွန်သော ပံ့ပိုးကူညီမှုရှိသော Trino ကို ရွေးချယ်ခဲ့ပြီး အဖွဲ့သည် တုံ့ပြန်မှုအလွန်ကောင်းမွန်သောကြောင့် bug တစ်ခုကို နောက်ရက်တွင် ပြင်ဆင်ပြီး နောက်အပတ်တွင် နောက်ဆုံးဗားရှင်းသို့ ဖြန့်ချိခဲ့သည်။ ၎င်းသည် မြင့်မားသောအကောင်အထည်ဖော်မှုတုံ့ပြန်မှုလိုအပ်သော Footprint အဖွဲ့အတွက် အကောင်းဆုံးရွေးချယ်မှုဖြစ်သည်။
၄.၃။ စွမ်းဆောင်ရည်စမ်းသပ်ခြင်း။
ကျွန်ုပ်တို့၏ ဦးတည်ချက်ကို ဆုံးဖြတ်ပြီးသည်နှင့် ကျွန်ုပ်တို့သည် ကျွန်ုပ်တို့၏လိုအပ်ချက်များကို ဖြည့်ဆည်းပေးနိုင်ပြီး ကျွန်ုပ်တို့၏ အံ့အားသင့်စရာဖြစ်နိုင်ချေရှိမရှိ သိနိုင်ရန် Trino + Iceberg ပေါင်းစပ်မှုတွင် စွမ်းဆောင်ရည်စမ်းသပ်မှုတစ်ခု ပြုလုပ်ခဲ့ပါသည်။
Presto + Hive သည် OLAP ဖောင်းပွမှုအားလုံးတွင် နှစ်အတော်ကြာ အဆိုးဆုံး နှိုင်းယှဥ်ပြနေမှန်း သိသဖြင့် Trino + Iceberg ပေါင်းစပ်မှုက ကျွန်ုပ်တို့၏စိတ်ကို လုံးလုံးလျားလျား ထိခိုက်စေခဲ့သည်။
ဤသည်မှာ ကျွန်ုပ်တို့၏ စမ်းသပ်မှုရလဒ်များဖြစ်သည်။
case 1- ကြီးမားသောဒေတာအတွဲကို ချိတ်ဆက်ပါ။
800 GB table1 သည် အခြား 50 GB table2 နှင့် ချိတ်ဆက်ပြီး ရှုပ်ထွေးသော လုပ်ငန်းဆိုင်ရာ တွက်ချက်မှုများကို လုပ်ဆောင်သည်။
case2- ကွဲပြားသောမေးမြန်းချက်တစ်ခုပြုလုပ်ရန် ကြီးမားသောဇယားတစ်ခုကို အသုံးပြုပါ။
စမ်းသပ် sql- နေ့အလိုက် ဇယားအုပ်စုမှ ကွဲပြားသော(လိပ်စာ)ကို ရွေးပါ။
Trino+Iceberg ပေါင်းစပ်မှုသည် တူညီသောဖွဲ့စည်းပုံတွင် Doris ထက် ၃ ဆခန့် ပိုမြန်သည်။
ထို့အပြင်၊ Iceberg သည် ဒေတာကို ချုံ့ပြီး သိမ်းဆည်းပေးမည့် Parquet၊ ORC စသည်တို့ကဲ့သို့ ဒေတာဖော်မတ်များကို သုံးနိုင်သောကြောင့် နောက်ထပ် အံ့သြစရာတစ်ခုရှိပါသည်။ Iceberg ၏ စားပွဲတင်သိုလှောင်မှုသည် အခြားဒေတာဂိုဒေါင်များ၏ နေရာလွတ်၏ 1/5 ခန့်သာ ယူသည်။ ဒေတာဘေ့စ်သုံးခုရှိ ဇယားတစ်ခုတည်း၏ သိုလှောင်မှုအရွယ်အစားမှာ အောက်ပါအတိုင်းဖြစ်သည်။
မှတ်ချက်- အထက်ဖော်ပြပါ စမ်းသပ်မှုများသည် အမှန်တကယ် ထုတ်လုပ်ရေးတွင် ကျွန်ုပ်တို့ကြုံတွေ့ခဲ့ရသည့် ဥပမာများဖြစ်ပြီး ကိုးကားရန်အတွက်သာ ဖြစ်သည်။
၄.၄။ အကျိုးသက်ရောက်မှုကို အဆင့်မြှင့်ပါ။
စွမ်းဆောင်ရည်စမ်းသပ်မှုအစီရင်ခံစာများသည် ကျွန်ုပ်တို့၏အဖွဲ့အား ပြောင်းရွှေ့ခြင်းပြီးမြောက်ရန် 2 လခန့် အချိန်ယူခဲ့ရကြောင်းနှင့် ၎င်းသည် အဆင့်မြှင့်ပြီးနောက် ကျွန်ုပ်တို့၏ဗိသုကာလက်ရာ၏ ပုံကြမ်းဖြစ်သည်။
- ကွန်ပြူတာအင်ဂျင်များစွာသည် ကျွန်ုပ်တို့၏လိုအပ်ချက်အမျိုးမျိုးကို လိုက်ဖက်ပါသည်။
- Trino သည် DBT ကို ပံ့ပိုးထားပြီး Iceberg ကို တိုက်ရိုက်မေးမြန်းနိုင်သောကြောင့် ကျွန်ုပ်တို့သည် ဒေတာထပ်တူပြုခြင်းကို ကိုင်တွယ်ဖြေရှင်းရန် မလိုအပ်တော့ပါ။
- Trino + Iceberg ၏အံ့သြဖွယ်စွမ်းဆောင်ရည်သည် ကျွန်ုပ်တို့၏အသုံးပြုသူများအတွက် Bronze data (ကုန်ကြမ်းဒေတာ) အားလုံးကို ဖွင့်နိုင်စေပါသည်။
5 ။ အကျဉ်းချုပ်
2021 ခုနှစ်သြဂုတ်လတွင်စတင်မိတ်ဆက်ခဲ့ပြီးကတည်းက Footprint Analytics အဖွဲ့သည် တစ်နှစ်ခွဲအတွင်း ဗိသုကာမွမ်းမံပြင်ဆင်မှု XNUMX ခုကို ပြီးမြောက်ခဲ့ပြီး၊ ၎င်း၏ခိုင်မာသောဆန္ဒနှင့် ၎င်း၏အကောင်းဆုံးဒေတာဘေ့စ်နည်းပညာ၏အကျိုးကျေးဇူးများကို ၎င်း၏ crypto အသုံးပြုသူများထံ ယူဆောင်လာရန်နှင့် အကောင်အထည်ဖော်ရာတွင် ခိုင်မာသော ကတိကဝတ်များကို ဆောင်ကြဉ်းပေးရန်အတွက် ပြင်းပြသောဆန္ဒနှင့် ဆုံးဖြတ်ချက်ကြောင့်၊ ၎င်း၏အခြေခံအဆောက်အအုံနှင့် ဗိသုကာပညာကို အဆင့်မြှင့်တင်ခြင်း။
Footprint Analytics ဗိသုကာ အဆင့်မြှင့်တင်မှု 3.0 သည် ၎င်း၏အသုံးပြုသူများအတွက် အတွေ့အကြုံအသစ်တစ်ခုကို ဝယ်ယူခဲ့ပြီး နောက်ခံအမျိုးမျိုးမှ အသုံးပြုသူများအား ပိုမိုကွဲပြားသောအသုံးပြုမှုနှင့် အပလီကေးရှင်းများတွင် ထိုးထွင်းသိမြင်မှုရရှိစေသည်-
- Metabase BI ကိရိယာဖြင့်တည်ဆောက်ထားသော Footprint သည် ခွဲခြမ်းစိတ်ဖြာသူအား ကုဒ်လုပ်ထားသော ကွင်းဆက်ဒေတာကို ဝင်ရောက်ကြည့်ရှုခွင့်ရရန်၊ စူးစမ်းလေ့လာရန်၊ လွတ်လပ်စွာရွေးချယ်ခွင့်အပြည့်ရှိသောကိရိယာများ (no-code သို့မဟုတ် hardcord)၊ မှတ်တမ်းတစ်ခုလုံးကို စုံစမ်းမေးမြန်းရန်နှင့် ဒေတာအတွဲများကို ထဲထဲဝင်ဝင်ဝင်ရောက်ကြည့်ရှုနိုင်ရန်၊ အချိန်မရှိ။
- web2 + web3 တစ်လျှောက် ခွဲခြမ်းစိတ်ဖြာရန်အတွက် ကွင်းဆက်နှင့် ကွင်းဆက်ဒေတာ နှစ်ခုလုံးကို ပေါင်းစပ်ပါ။
- Footprint ၏ စီးပွားရေးဆိုင်ရာ စိတ်ကူးစိတ်သန်းများ၏ထိပ်တွင် တည်ဆောက်ခြင်း/မေးမြန်းခြင်း မက်ထရစ်များကို တည်ဆောက်ခြင်းဖြင့်၊ လေ့လာဆန်းစစ်သူများ သို့မဟုတ် ဆော့ဖ်ဝဲအင်ဂျင်နီယာများသည် ထပ်တလဲလဲဒေတာလုပ်ဆောင်ခြင်းလုပ်ငန်း၏ 80% အတွက် အချိန်ကုန်သက်သာစေပြီး ၎င်းတို့၏လုပ်ငန်းအပေါ်အခြေခံ၍ အဓိပ္ပာယ်ရှိသော မက်ထရစ်များ၊ သုတေသနနှင့် ထုတ်ကုန်ဖြေရှင်းချက်များကို အာရုံစိုက်ပါ။
- SQL ကိုအခြေခံ၍ Footprint ဝဘ်မှ REST API ခေါ်ဆိုမှုများအထိ ချောမွေ့မှုမရှိသော အတွေ့အကြုံ
- ရင်းနှီးမြှုပ်နှံမှုဆိုင်ရာ ဆုံးဖြတ်ချက်များကို ပံ့ပိုးရန် အဓိကအချက်ပြမှုများတွင် အချိန်နှင့်တပြေးညီ သတိပေးချက်များနှင့် လုပ်ဆောင်နိုင်သော သတိပေးချက်များ
အရင်းအမြစ်- https://cryptoslate.com/iceberg-spark-trino-a-modern-open-source-data-stack-for-blockchain/