Al Generative Art အသစ်ကို ကြည့်ပါ။

အယ်လ် ဂျင်နရယ်အနုပညာ အများစုမှာ အမြင်အာရုံအနုပညာ အမျိုးအစားတစ်ခုဖြစ်ပြီး လူသားတစ်ဦးနှင့် ကိုယ်ပိုင်အုပ်ချုပ်ခွင့်ရစနစ်တို့ကြား ပူးပေါင်းဆောင်ရွက်မှုအပေါ် အခြေခံထားသည်။ “ကိုယ်ပိုင်အုပ်ချုပ်ခွင့်ရစနစ်” လို့ သတ်မှတ်ပါတယ်။ ဉာဏ်ရည်တု ပရိုဂရမ်မာစွက်ဖက်မှုမလိုအပ်ဘဲ ရှုပ်ထွေးသောလုပ်ဆောင်မှုများကို လုပ်ဆောင်နိုင်သည့်ဆော့ဖ်ဝဲလ်၊ အယ်လဂိုရီသမ် သို့မဟုတ် မော်ဒယ်။

ဖန်တီးထားသော ပုံများ၏ ထူးထူးဆန်းဆန်း ပေါင်းစပ်မှုများမှ Dall-E Mini အမှ NFT စျေးကွက်၊ AI algorithms မှထုတ်လုပ်သောရုပ်ပုံများသည်ပင်မစိတ်ကူးစိတ်သန်းထဲသို့ပိုမိုဝင်ရောက်လာသည်။ အမှန်မှာ၊ ခွဲခြမ်းစိတ်ဖြာရန် ထိုက်တန်သော ဘာသာရပ်ဆိုင်ရာ အရေးကြီးသော ပရောဂျက်နှစ်ခုမှာ- လမ်းလယ် နှင့် DALL-E2.

ဟုတ်ပါတယ်၊ ဒီသတင်းက Twitter ဆီကို ရောက်သွားပါပြီ။ ၎င်းအပေါ် မှတ်ချက်ပေးသူမှာ Charles Hoskinson ဖြစ်ပြီး၊

Al Generative Art- အစောပိုင်း စမ်းသပ်မှုများနှင့် လုပ်ဆောင်ချက်များ

Generative Art ဆိုသည်မှာ ဘာလဲဆိုတာကို နားလည်ပြီး ၎င်း၏ အခြေခံမူများထဲမှ တစ်ခုကို အလေးထားရန် အရေးကြီးသည်- ကျပန်း. Generative Art ၏ အခြေခံ ပိုင်ဆိုင်မှုတစ်ခုဖြစ်သည်။

အမှန်မှာ၊ ဆော့ဖ်ဝဲအမျိုးအစားပေါ်မူတည်၍ autonomous system သည် generate command ကို execute လုပ်တိုင်း အမြဲတမ်းကွဲပြားပြီး ထူးခြားသည့်ရလဒ်များကို စီမံဆောင်ရွက်နိုင်သည် သို့မဟုတ် အသုံးပြုသူထည့်သွင်းမှုကို တုံ့ပြန်သည့်အနေဖြင့် ပြောင်းလဲနိုင်သောရလဒ်များစွာကို ပြန်ပေးနိုင်သည်။

Generative Art တွင် ပထမဆုံးစမ်းသပ်မှုများသည် လက်တွေ့စမ်းသပ်မှုများဖြင့် 1960 ခုနှစ်များအတွင်းက စတင်ခဲ့သည်။ Harold Cohen နှင့်သူ၏ အာရုန် အစီအစဉ်။ Cohen သည် Pop Art Silkscreens မှ မှုတ်သွင်းထားသော စိတ္တဇအနုပညာလက်ရာများကို ဖန်တီးရန်အတွက် သီးသန့်ဆော့ဖ်ဝဲကို ပထမဆုံးအသုံးပြုခဲ့သည်။ Cohen ၏လက်ရာများကို လန်ဒန်ရှိ Tate Gallery တွင် ပြသနေပြီဖြစ်သည်။

Generative Art ၏နောက်ထပ်ဂုဏ်ရည်တော်၊ အခွင့်အာဏာပိုနည်းသည်ကား၊ ပရိုဂရမ်မာမှပေးသောပုံစံများ သို့မဟုတ် စိတ္တဇဒြပ်စင်များကို ထပ်ခါတလဲလဲပြုလုပ်ပြီး ဆော့ဖ်ဝဲလ်ကုဒ်အတွင်းထည့်သွင်းထားသည်။

ထို့အပြင်၊ ပိုမိုရှုပ်ထွေးသော အာရုံကြောကွန်ရက်များ၏ ဖွံ့ဖြိုးတိုးတက်မှုသည် ပိုမိုလက်တွေ့ကျပြီး တိကျသောပုံများကို ဖန်တီးနိုင်သည့် မျိုးဆက်သစ်မော်ဒယ်များကို ဖွံ့ဖြိုးတိုးတက်စေပါသည်။ Generative Art အမျိုးအစား၏ အထင်ရှားဆုံး ဥပမာမှာ ပြားချပ်.

Dall-E သည် multimodal neural network ကို အခြေခံ၍ ဖြစ်သည်။ GPT-3 နက်ရှိုင်းသောသင်ယူမှုပုံစံထံမှ OpenAIမကြာသေးမီကမှ တီထွင်ခဲ့သော ကုမ္ပဏီတစ်ခုဖြစ်သည်။ GPT ချတ်chatbot ကို 2022 ခုနှစ် နိုဝင်ဘာလတွင် စတင်ခဲ့ပြီး အကောင်းဆုံးဖြစ်အောင် ပြုလုပ်ထားသည်။ “ကြီးကြပ်” နှင့် အားဖြည့်သင်ကြားရေးနည်းပညာများ။

Dall-E သို့ပြန်သွားသောအခါ၊ ဤစနစ်သည် a ဟုခေါ်သော စာသားဖော်ပြချက်မှ ပုံများကိုထုတ်ပေးနိုင်စွမ်းရှိကြောင်း ကျွန်ုပ်တို့တွေ့မြင်ရပါသည်။ “အချက်ပေး၊” စာသား-ရုပ်ပုံအတွဲများ၏ ဒေတာအတွဲတစ်ခုအပေါ် အခြေခံသည်။

2021 ခုနှစ် ဇန်နဝါရီလတွင် အများသူငှာ တင်ဆက်ခဲ့သည့် Dall-E ၏ ပထမဆုံးဗားရှင်းသည် နယ်ပယ်တွင်းရှိ ကျွမ်းကျင်ပညာရှင်အနည်းစု၏ အခွင့်ထူးခံအဖြစ် ဆက်လက်တည်ရှိနေကာ GPT- ၏ ဆန်းသစ်တီထွင်မှုများကို ကျော်လွန်ကာ ဤမျိုးဆက်သစ်ပုံစံ၏ အသွင်အပြင်ကို ကိုယ်စားပြုသည်။ သူ့ဟာသူ ၃။

ထို့အပြင် Dall-E မှ လုပ်ဆောင်ခဲ့သော ရလဒ်များ၏ တိကျမှုသည် အခြားသော OpenAI ဖြေရှင်းချက်အတွက် ပြီးပြည့်စုံသော နယ်ပယ်ဖြစ်ကြောင်း သက်သေပြခဲ့သည့်အချက်လည်း အရေးကြီးပါသည်။ ကလစ် (Contrastive Language-Image Pre-training)။

အင်တာနက်ပေါ်ရှိ စာတန်းများကဲ့သို့သော စာသား-ရုပ်ပုံ ချိတ်ဆက်မှုများကို အခြေခံ၍ လေ့ကျင့်ထားသော ရုပ်ပုံအမျိုးအစားခွဲခြင်းနှင့် အဆင့်သတ်မှတ်ခြင်း အာရုံကြောကွန်ရက်။ CLIP ၏ဝင်ရောက်စွက်ဖက်မှုကြောင့်၊ အသုံးပြုသူထံတင်ပြသည့်ရလဒ်အရေအတွက်ကို 32 အထိလျှော့ချပေးသောကြောင့်၊ Dall-E သည် ကိစ္စအများစုတွင် ကျေနပ်လောက်သောပုံများကိုပြန်ပေးသည်ကိုတွေ့ရှိရပါသည်။

နေ့လယ်ပိုင်း- ဒီဇိုင်း၊ လူ့အခြေခံအဆောက်အအုံနှင့် ဉာဏ်ရည်တု

မျှော်မှန်းထားသည့်အတိုင်း၊ လမ်းလယ် ပေါ်ပေါက်လာသော Al Generative Art အယူအဆ၏ တစ်စိတ်တစ်ပိုင်းဖြစ်သော အရေးကြီးသော ပရောဂျက်တစ်ခုဖြစ်သည်။ အထူးသဖြင့်၊ Midjourney သည် လူသားမျိုးစိတ်များ၏ စိတ်ကူးဉာဏ်စွမ်းအားများကို ချဲ့ထွင်ကာ တွေးခေါ်နည်းသစ်များကို ရှာဖွေဖော်ထုတ်သည့် လွတ်လပ်သော သုတေသနဓာတ်ခွဲခန်းတစ်ခုဖြစ်သည်။

၎င်းကိုအသုံးပြုခြင်းသည် ရိုးရှင်းပါသည်- ပထမဆုံး အကောင့်တစ်ခုကို ဖန်တီးရပါမည်။ စိတ်တိုးပွားMidjourney သည် ၎င်းတို့ထဲမှ တစ်ခုဖြစ်သည့် အသိုင်းအဝိုင်းအမျိုးမျိုးကို လက်ခံကျင်းပပေးသည့် ပလက်ဖောင်းတစ်ခုဖြစ်သည်။ အပလီကေးရှင်းအတွင်းတွင် တက်ကြွစွာပါဝင်နိုင်သည် သို့မဟုတ် မဆွေးနွေးနိုင်သည့် အမျိုးမျိုးသော chatroom များရှိသည်။

Artificial Intelligence ကို ပထမဆုံး အကြိမ် စမ်းသုံးကြည့်ဖို့ အရေးကြီးပါတယ်။ "အသစ်စက်စက်များ" ချန်နယ်တွေ ဘယ်မှာလဲ။ 25 အခမဲ့ renders ရရှိနိုင်ပါသည်။

တင်ဆက်မှုတစ်ခုသည် တူညီသောစာသားထည့်သွင်းမှုမှထုတ်ပေးသော မတူညီသောမူကွဲလေးမျိုး၏မျိုးဆက်နှင့် ကိုက်ညီပါသည်။

ထို့ကြောင့်၊ 25 renders သည် Midjourney bot မှလုပ်ဆောင်သည့်လုပ်ငန်းစဉ် 25 ခုကိုရည်ညွှန်းသည်။ ထို့ကြောင့်၊ ရုပ်ပုံထုတ်လုပ်ခြင်းတွင် Midjourney bot နှင့် အပြန်အလှန်ဆက်သွယ်ရန် လိုအပ်ပြီး ၎င်းတွင် အသုံးပြုသူ၏စိတ်တွင်ရှိသော ရုပ်ပုံကို ဖော်ပြသည့်သော့ချက်စကားလုံးများပါရှိမည့် “prompt” ဟုခေါ်သည်။

သင်လိုချင်သလောက် အသေးစိတ်အချက်အလက်များကို သင်ထည့်နိုင်သည်၊ အရေးကြီးသည်မှာ သော့ချက်စာလုံးများကို ကော်မာဖြင့် ပိုင်းခြားရန်ဖြစ်သည်။ rendering ပြီးသည်နှင့်၊ ကွန်ပျူတာသည် ရွေးချယ်ရန် ဖော်ပြချက်များအပေါ် အခြေခံ၍ မတူညီသော ပုံလေးခုကို ပြန်ပေးသည်။

ထို့အပြင်၊ ပရိုဂရမ်ကို တင်ဆက်ခြင်းပြီးသည်နှင့်၊ သင်သည် ရုပ်ပုံများပေါ်အခြေခံ၍ သင့်စိတ်ကြိုက်ရွေးချယ်မှုများကို ဆက်သွယ်နိုင်ပြီး၊ သင်ဆန္ဒရှိပါက နောက်ထပ်ဗားရှင်းလေးမျိုး ထပ်မံထုတ်ပေးမည်ဖြစ်သည်။

DALL-E 2- အနုပညာလက်ရာများအတွက် AI စနစ်အသစ်

Midjourney အပြင်၊ DALL-E 2 သည် သဘာဝဘာသာစကားဖော်ပြချက်မှ လက်တွေ့ဆန်သော ရုပ်ပုံများနှင့် အနုပညာလက်ရာများကို ဖန်တီးနိုင်သည့် AI စနစ်အသစ်လည်းဖြစ်သည်။ ထို့အပြင် DALL-E 2 သည် သဘောတရားများ၊ အရည်အချင်းများနှင့် ပုံစံများကို ပေါင်းစပ်နိုင်သည်။

AI စနစ်အသစ်၏ အားသာချက်မှာ မူရင်းကင်းဗတ်တွင်ရှိသော ရုပ်ပုံများကို ချဲ့ထွင်ဖန်တီးနိုင်ခြင်း၊ ကျယ်ပြန့်သောဖွဲ့စည်းမှုအသစ်များ. ထို့အပြင်၊ ၎င်းသည် သဘာဝဘာသာစကားစာတန်းမှ ရှိပြီးသားပုံများကို လက်တွေ့ကျကျ ပြောင်းလဲမှုများ ပြုလုပ်နိုင်ပြီး အရိပ်များ၊ ရောင်ပြန်ဟပ်မှုများနှင့် အသွင်အပြင်များကို ထည့်သွင်းစဉ်းစားကာ ဒြပ်စင်များကို ပေါင်းထည့်ကာ ဖယ်ရှားနိုင်သည်။

DALL-E 2 ၏ စွမ်းဆောင်နိုင်ရည်များသည် ပုံတစ်ပုံရိုက်ခြင်းနှင့် မူရင်းပုံစံဖြင့် မှုတ်သွင်းထားသော ပုံစံအမျိုးမျိုးကို ဖန်တီးခြင်းတို့လည်း ပါဝင်သည်။ DALL-E 2 သည် ရုပ်ပုံများနှင့် ဖော်ပြရန် အသုံးပြုသည့် စာသားကြား ဆက်နွယ်မှုကို လေ့လာခဲ့သည်။

ဟုခေါ်သော လုပ်ငန်းစဉ်ကို အသုံးပြုသည်။ "ပျံ့လွင့်ခြင်း" ၎င်းသည် ကျပန်းအစက်ပုံစံဖြင့် စတင်ကာ ထိုပုံ၏ သီးခြားရှုထောင့်များကို မှတ်မိသောအခါတွင် ၎င်းပုံစံကို ပုံတစ်ခုဆီသို့ တဖြည်းဖြည်း ပြောင်းလဲစေသည်။

ထို့ကြောင့်၊ OpenAI သည် ဇန်နဝါရီ 2021 တွင် DALL-E ကိုမိတ်ဆက်ပြီးနောက်၊ ယခုနောက်ဆုံးပေါ်စနစ်ဖြစ်သည့် DALL-E 2 သည် ကြည်လင်ပြတ်သားမှုလေးဆပိုမိုလက်တွေ့ကျပြီး တိကျသောပုံများကိုထုတ်ပေးသည်။

DALL-E 2 ကို သုတေသနပရောဂျက်တစ်ခုအဖြစ် စတင်ခဲ့ပြီး ယခုအခါတွင် တစ်ခုအနေဖြင့် ရရှိနိုင်ပြီဖြစ်သည်။ beta ဗားရှင်း. စနစ်က တီထွင်ပြီး ဆက်လက်တိုးတက်နေသည့် လုံခြုံရေးဆိုင်ရာ လျော့ပါးသက်သာမှုများတွင်- ကြမ်းတမ်းသော၊ အမုန်းပွားခြင်း သို့မဟုတ် အရွယ်ရောက်ပြီးသူ၏ ရုပ်ပုံများကို ထုတ်လုပ်နိုင်စွမ်းကို ကန့်သတ်ခြင်းနှင့် သင်ယူမှုအခြေခံသည့် အဆင့်လိုက် ဖြန့်ကျက်ခြင်းတို့ ပါဝင်ပါသည်။

အရင်းအမြစ်- https://en.cryptonomist.ch/2023/02/02/ai-generative-art/