د ماشین زده کړې ساحه مختلف میتودونه او تمثیلونه لري، هر یو د مختلف ډوله ډیټا او ستونزو لپاره مناسب دی. د دې تمثیلونو په منځ کې، نظارت شوي او نه څارل شوي زده کړې دوه خورا بنسټیز دي.
څارل شوي زده کړه په لیبل شوي ډیټا سیټ کې د ماډل روزنه شامله ده، چیرې چې د ان پټ ډاټا د سم محصول سره یوځای کیږي. ماډل زده کوي چې د خپلو وړاندوینو او ریښتیني محصولاتو ترمینځ غلطۍ کمولو سره محصولاتو ته د معلوماتو نقشه کړي. له بلې خوا غیر څارل شوي زده کړه، د لیبل شوي ډاټا سره معامله کوي، چیرې چې هدف د ډیټا پوائنټونو په سیټ کې موجود طبیعي جوړښت معلومول دي.
د زده کړې یو ډول شتون شتون لري چې دواړه څارل شوي او غیر څارل شوي زده کړې تخنیکونه سره یوځای کوي چې ډیری وختونه د نیمه څارنې زده کړې په نوم یادیږي. دا طریقه د روزنې پروسې په جریان کې دواړه لیبل شوي او غیر لیبل شوي ډاټا کاروي. د نیمه څارل شوي زده کړې دلیل دا دی چې بې لیبل شوي ډاټا، کله چې د لیبل شوي لږ مقدار سره په ګډه کارول کیږي، کولی شي د زده کړې دقت کې د پام وړ پرمختګ رامینځته کړي. دا په ځانګړې توګه په سناریوګانو کې ګټور دی چیرې چې لیبل شوي معلومات کم یا ګران دي ترلاسه کول، مګر بې لیبل شوي ډاټا خورا ډیر او د راټولولو لپاره اسانه دي.
نیمه څارل شوي زده کړه د دې انګیرنې له مخې اټکل کیږي چې د لیبل شوي ډیټا اصلي جوړښت کولی شي ارزښتناک معلومات چمتو کړي چې د لیبل شوي ډیټا بشپړونکي وي. دا انګیرنه کولی شي ډیری بڼې ولري، لکه د کلستر انګیرنه، څو اړخیزه انګیرنه، یا د ټیټ کثافت جلا کولو انګیرنه. د کلستر انګیرنه دا په ګوته کوي چې په ورته کلستر کې د معلوماتو ټکي احتمال لري ورته لیبل ولري. څو اړخیزه انګیرنه وړاندیز کوي چې لوړ ابعادي معلومات د ډیری ټیټ ابعاد په څو اړخیزه کې پروت دي، او دنده دا ده چې دا څو اړخیز زده کړي. د ټیټ کثافت جلا کولو انګیرنه د دې مفکورې پراساس ده چې د پریکړې حد باید د ټیټ ډیټا کثافت په سیمه کې وي.
یو له عام تخنیکونو څخه چې په نیمه څارل شوي زده کړې کې کارول کیږي د ځان روزنه ده. په ځان روزنه کې، یو ماډل په پیل کې د لیبل شوي معلوماتو په اړه روزل کیږي. دا بیا د غیر لیبل شوي ډیټا په اړه خپل وړاندوینې د سیډو لیبل په توګه کاروي. ماډل نور هم په دې وده شوي ډیټاسیټ کې روزل شوي، په تکراري توګه د هغې وړاندوینې اصالح کوي. بل تخنیک همغږي روزنه ده، چیرې چې دوه یا ډیر ماډلونه په یو وخت کې د ډیټا مختلف نظرونو کې روزل کیږي. هر ماډل د غیر لیبل شوي ډیټا یوې برخې لیبل کولو مسؤلیت لري ، کوم چې بیا د نورو ماډلونو روزنې لپاره کارول کیږي. دا میتود د زده کړې فعالیت ښه کولو لپاره د ډیټا ډیری لیدونو کې بې ځایه کیدو څخه ګټه پورته کوي.
د ګراف پر بنسټ میتودونه په نیمه څارل شوي زده کړې کې هم شتون لري. دا میتودونه یو ګراف رامینځته کوي چیرې چې نوډونه د ډیټا پوائنټونو استازیتوب کوي ، او څنډې د دوی ترمینځ ورته والی څرګندوي. د زده کړې دنده بیا د ګراف پر بنسټ د اصلاح کولو ستونزې په توګه اصالح کیږي، چیرته چې هدف د لیبل شوي نوډونو څخه لیبلونو ته د ګراف جوړښت ساتلو په وخت کې د لیبلونو تبلیغ کول دي. دا تخنیکونه په ځانګړې توګه په ډومینونو کې اغیزمن دي چیرې چې ډاټا په طبیعي توګه شبکه جوړوي، لکه ټولنیز شبکې یا بیولوژیکي شبکې.
د نظارت شوي او غیر څارل شوي زده کړې یوځای کولو بله لاره د څو کاري زده کړې له لارې ده. په څو کاري زده کړو کې، د زده کړې ډیری دندې په ورته وخت کې حل کیږي، پداسې حال کې چې د دندو په اوږدو کې مشترکات او توپیرونه کاروي. دا کیدای شي د انګیزه لیږد د یوې بڼې په توګه ولیدل شي، چیرې چې د یو کار څخه ترلاسه شوي پوهه د بل زده کړې ښه کولو کې مرسته کوي. د څو کارونو زده کړه په ځانګړي ډول ګټور کیدی شي کله چې د دندو په مینځ کې د ګډ نمایش یا ځانګړتیا ځای شتون ولري، د معلوماتو لیږد ته اجازه ورکوي.
د نیمه څارل شوي زده کړې یوه عملي بیلګه د طبیعي ژبې پروسس (NLP) په برخه کې ده. د احساساتو تحلیل دنده په پام کې ونیسئ، چیرې چې هدف دا دی چې یو ورکړل شوی متن د مثبت یا منفي په توګه طبقه بندي کړي. لیبل شوي ډاټا، لکه د احساساتو لیبلونو سره بیاکتنې، ممکن محدود وي. په هرصورت، د لیبل شوي متن پراخه اندازه شتون لري. د نیمه څارل شوي زده کړې طریقه کولی شي په لیبل شوي ډیټا کې د احساس ډلبندۍ روزنه او د لیبل شوي معلوماتو د احساساتو وړاندوینې لپاره د هغې کارول شامل وي. دا وړاندوینې بیا د اضافي روزنې ډیټا په توګه کارول کیدی شي، د ډلبندۍ فعالیت ښه کوي.
بله بیلګه د عکس طبقه بندي کې موندل کیدی شي. په ډیری قضیو کې، د لیبل شوي عکسونو ترلاسه کول خورا ګران او ګران دي، پداسې حال کې چې بې لیبل شوي عکسونه ډیر دي. یو نیمه څارل شوی چلند ممکن د ابتدايي ماډل روزنې لپاره د لیبل شوي عکسونو کوچنۍ سیټ کارول شامل وي. دا ماډل بیا د سیډو لیبلونو رامینځته کولو لپاره په لیبل شوي عکسونو کې پلي کیدی شي ، کوم چې وروسته د ماډل بیا روزنې لپاره کارول کیږي.
د نیمه څارل شوي زده کړې او اړوندو میتودونو له لارې د نظارت شوي او غیر څارل شوي زده کړې ادغام د ماشین زده کړې کې د ځواکمن چلند استازیتوب کوي. د دواړو تمثیلونو پیاوړتیا په کارولو سره، دا ممکنه ده چې د ماډل فعالیت کې د پام وړ پرمختګونه ترلاسه کړئ، په ځانګړې توګه په هغو ډومینونو کې چیرې چې لیبل شوي ډاټا محدود وي مګر لیبل شوي ډاټا ډیر وي. دا طریقه نه یوازې د محدودو معلوماتو څخه د عمومي کولو لپاره د ماډلونو وړتیا لوړوي بلکه د پیچلو ډیټاسیټونو د اصلي جوړښت د پوهیدو لپاره یو پیاوړی چوکاټ هم چمتو کوي.
په اړه نورې وروستۍ پوښتنې او ځوابونه EITC/AI/GCML د ګوګل بادل ماشین زده کړه:
- ایا د ماشین زده کړې په جریان کې له یو څخه ډیر ماډلونه پلي کیدی شي؟
- آیا د ماشین زده کړه کولی شي د سناریو پورې اړوند کوم الګوریتم وکاروي؟
- د ګوګل AI پلیټ فارم کې د وړیا درجې/آزموینې په کارولو سره د ګوګل AI پلیټ فارم کې د ډیری اساسي تدریسي AI ماډل روزنې او ځای پرځای کولو لپاره ترټولو ساده لاره څه ده چې د GUI کنسول په کارولو سره په ګام په ګام ډول د یو مطلق پیل کونکي لپاره پرته له کوم پروګرام کولو شالید څخه وي؟
- څنګه په ګام په ګام ټیوټوریل کې د GCP کنسول د GUI انٹرفیس له لارې په ګوګل کلاوډ AI پلیټ فارم کې ساده AI ماډل په عملي توګه وروزل او ځای په ځای کړئ؟
- په ګوګل کلاوډ کې د ویشل شوي AI ماډل روزنې تمرین کولو لپاره ترټولو ساده، ګام په ګام پروسه څه ده؟
- لومړنی ماډل کوم دی چې یو څوک پرې کار کولی شي د پیل لپاره د ځینو عملي وړاندیزونو سره؟
- ایا الګوریتمونه او وړاندوینې د انساني اړخ څخه د ترلاسه شویو معلوماتو پراساس دي؟
- د طبیعي ژبې د پروسس کولو ماډل جوړولو لپاره اصلي اړتیاوې او ساده میتودونه څه دي؟ څنګه کولی شي د شته وسیلو په کارولو سره داسې ماډل جوړ کړي؟
- ایا د دې وسایلو کارولو لپاره میاشتنی یا کلنی ګډون ته اړتیا ده، یا د وړیا کارونې یوه ټاکلې اندازه شتون لري؟
- د روزنې ماډل پیرامیټرو په شرایطو کې یو دور څه شی دی؟
نورې پوښتنې او ځوابونه په EITC/AI/GCML د ګوګل کلاوډ ماشین زده کړې کې وګورئ