Machine Learning Libraries For Absolute Beginners

1662 views Nov 21, 2024

ကျွန်တော်တို့ ဒီသင်ခန်းစာမှာတော့ လက်ရှိ machine learning နဲ့ ပတ်သတ်ပြီး လုပ်ငန်းခွင်ထဲမှာ professional တွေ ဘယ် library တွေ အဓိက သုံးနေကျလဲကို ရှင်းပြသွားပါမယ်။ဒီ tutorial ရဲ့ ရည်ရွယ်ချက်က Python Programming နဲ့ machine learning ကို စလေ့လာရင် သုံးတဲ့ library တွေကို overview လောက်သိပြီး ဆက်လေ့လာနိုင်ဖို့ရည်ရွယ်ပါတယ်ခင်ဗျာ။

1.Numpy
Machine learning ပိုင်းမှာ data တွေကို အရမ်းတွက်ချက်ရပါတယ်။Python သည် interpreter language မို့ နှေးတယ်ဆိုတာအားလုံးသိပြီးသားလို့ထင်ပါတယ်။ဒီတော့ ကျွန်တော်တို့ များပြားလှစွာသော data point တွေကို မြန်မြန်လေး တွက်ချက်ဖို့ဆို အရမ်းမြန်တဲ့ numpy လို library ကို သုံးရပါတယ်။

Numpy သည် အရမ်းမြန်တဲ့ C programming Language နဲ့ရေးထားပြီး python မှာပြန်သုံးလို့ရအောင် လုပ်ပေးထားတဲ့ library ပါ။တနည်းအားဖြင့် C code တွေပေါ် python အုပ်ထားတဲ့ library ဖြစ်ပါတယ်။

ဒါဆို numpy ကိုနားလည်မယ်ထင်ပါတယ်။Data point တွေကို မြန်မြန်ဆန်ဆန် compute လုပ်ဖို့သုံးပါတယ်။

2.Pandas
Machine learning လုပ်ပြီဆို structured data,tabular data များဖြစ်တဲ့ csv file ကလာတဲ့ data တွေ excel file က လာတဲ့ data တွေကို ကိုင်တွယ်ရတာများပါတယ်။

ဒီလိုမျိုးအလုပ်တွေလုပ်ရပြီဆို data analysis step များဖြစ်တဲ့ ဒီ csv file ထဲမှာ data တွေက ဘယ်လိုရှိတာလဲ ဒီ data တွေရဲ့ distribution ကကော ဘယ်လိုရှိလဲ user မဖြည့်ပဲထားခဲ့တဲ့ missing data point တွေကောပါလား စသဖြင့် analysis လုပ်ရတဲ့အခါ pandas ကို အထူးသုံးကျပါတယ်။နားမလည်ရင် စိတ်မပူပါနဲ့ နောက်ကျလုပ်ရင်းနားလည်သွားပါမယ်။

3.Matplotlib & Seaborn
ဒီ library တွေကိုတော့ data visualization လုပ်တဲ့အခါမှာအဓိကသုံးပါတယ်။ကိုယ်က cowokers တွေကို ကိုယ်ရှာတွေ့ထားတယ့် analysis လုပ်ထားတာကို သေချာလေးပြချင်လို့ပဲဖြစ်ဖြစ် ကိုယ်ပြန်ကြည့်ရင်လဲ ကိုယ်တည်ဆောက်ထားတဲ့ model performace ကို သေချာကြည့်လိုက်တာနဲ့ နားလည်အောင် visualize လုပ်ချင်တဲ့အခါ matplotlib,seaborn စတဲ့ data visualization library တွေသုံးပါတယ်။

4.Scikit Learn
ဒါကတော့ machine learning model တွေတည်ဆောက်ရာမှာ အဓိကသုံးတဲ့ library ဖြစ်ပါတယ်။သူ့မှာ machine learning algorithms ပေါင်းများစွာပါသလို machine learning project တွေလုပ်ရာမှာ လိုအပ်တဲ့ data preprocessing step တွေကို ဒီ library မှာ များစွာပါဝင်တာမို့ လုပ်ငန်းခွင်မှာ အဓိကသုံးကျပါတယ်။

5. Jupyter Notebook
jupyter notebook ကတော့ code တေါရေးပြီးစမ်းဖို့ပါ။ကိုယ်က data တွေကို interactive analysis လုပ်ချင်တာမျိုး ကိုယ်စမ်းထားတာကို ကိုယ်ရဲ့ coworkers တွေကို ပြန် sharingလုပ်ပေးချင်တာမျိုးမှာသုံးပါတယ်။

Jupyter Notebook ရဲ့ အားသာချက်က interactive ဖြစ်တာပေါ့ ကိုယ်က တစ်ခုခုစမ်းလိုက်ရင် ချက်ချင်း output ထွက်လာတယ် အဲ့တော့ machine learning သမားတွေအတွက်အကိုက်ပေါ့ data တွေကို ကြည့်လိုက် မကြိုက်ရင် ပြန်ပြင်လိုက် data က ဘယ်လိုပုံစံမျိုးတွေရှိလဲ interactive ကြည့်လို့ရတာပေါ့။

အဲ့တော့ လုံးဝမသိသေးတဲ့ သူတွေအတွက် အကြမ်းဖျင်းလောက်သိသွားမယ်လို့ ယုံကြည်ပါတယ်။အားလုံးအဆင်ပြေပါစေခင်ဗျာ။ဝင်ရောက်ဖတ်ပေးတဲ့အတွက် ကျေးဇူးအထူးတင်ပါတယ်။

ကျွန်တော်တို့ရဲ့ facebook page လေးမှာ reviews လေးတွေရေးပေးမယ်ဆို ကျွန်တော်တို့လဲ နောက် course တွေ tutorial တွေရေးပေးရတာ ပိုအားရှိတာမို့ အဆင်ပြေမယ်ဆို ရေးပေးစေချင်ပါတယ်ခင်ဗျာ။