د بست اندازه، د دورې، او ډیټاسیټ اندازه په حقیقت کې د ماشین زده کړې کې مهم اړخونه دي او معمولا د هایپرپرامیټرونو په توګه ویل کیږي. د دې مفکورې د پوهیدو لپاره، راځئ چې هر یو په انفرادي توګه وګورو.
د بسته اندازه:
د بیچ اندازه یو هایپرپرامیټر دی چې د نمونو شمیره ټاکي مخکې لدې چې د ماډل وزن د روزنې په جریان کې تازه شي پروسس شوي. دا د زده کړې پروسې سرعت او ثبات په ټاکلو کې مهم رول لوبوي. د کوچنۍ بستې اندازه د موډل وزنونو ته د نورو تازه معلوماتو لپاره اجازه ورکوي، چې د ګړندۍ همغږۍ لامل کیږي. په هرصورت، دا کولی شي د زده کړې پروسې ته شور هم معرفي کړي. له بلې خوا، د لوی بیچ اندازه د تدریجي ډیر باثباته اټکل چمتو کوي مګر کولی شي د روزنې بهیر ورو کړي.
د مثال په توګه، په سټوچیسټیک ګریډینټ نزول (SGD) کې، د 1 د بسته اندازه د خالص SGD په نوم پیژندل کیږي، چیرې چې ماډل د هر انفرادي نمونې پروسس کولو وروسته خپل وزن تازه کوي. برعکس، د یوې بستې اندازه چې د روزنې ډیټاسیټ اندازې سره مساوي وي د بیچ تدریجي نزول په نوم پیژندل کیږي، چیرې چې ماډل په هر دور کې یو ځل خپل وزن تازه کوي.
دور:
یو epoch یو بل هایپرپرامیټر دی چې د روزنې په جریان کې د عصبي شبکې له لارې د ټول ډیټاسیټ د تیریدو او شاته کیدو شمیره ټاکي. د څو دورونو لپاره د ماډل روزنه دا اجازه ورکوي چې په ډیټا کې پیچلي نمونې زده کړي د وزن په تکراري ډول تنظیم کولو سره. په هرصورت، د ډیری وختونو لپاره روزنه کولی شي د ډیر فټینګ لامل شي، چیرې چې ماډل د روزنې ډیټا کې ښه فعالیت کوي مګر د نه لیدل شوي معلوماتو عمومي کولو کې پاتې راځي.
د مثال په توګه، که چیرې یو ډیټاسیټ 1,000 نمونې ولري او ماډل د 10 دورو لپاره روزل شوی وي، دا پدې مانا ده چې ماډل د روزنې پروسې په جریان کې 10 ځله ټول ډیټاسیټ لیدلی.
د ډاټا اندازه:
د ډیټاسیټ اندازه د ماشین زده کړې ماډل روزنې لپاره موجود نمونو شمیر ته اشاره کوي. دا یو مهم فاکتور دی چې مستقیم د ماډل فعالیت او عمومي کولو وړتیا اغیزه کوي. د ډیټاسیټ لوی اندازه اکثرا د غوره ماډل فعالیت لامل کیږي ځکه چې دا د ماډل لپاره ډیر متنوع مثالونه وړاندې کوي چې زده کړي. په هرصورت، د لوی ډیټاسیټونو سره کار کول کولی شي کمپیوټري سرچینې او د روزنې لپاره اړین وخت هم زیات کړي.
په عمل کې، دا اړینه ده چې د ډیټاسیټ اندازې او ماډل پیچلتیا تر مینځ توازن رامینځته کړئ ترڅو د ډیر فټینګ یا کم فټینګ مخه ونیول شي. تخنیکونه لکه د ډیټا وده او منظم کول د محدود ډیټاسیټونو څخه ډیره ګټه پورته کولو لپاره کارول کیدی شي.
د بست اندازه، د دورې، او ډیټاسیټ اندازه ټول د ماشین زده کړې کې هایپر پارامیټرونه دي چې د روزنې پروسې او د ماډل وروستي فعالیت باندې د پام وړ اغیزه کوي. د دې هایپر پارامیټرونو په مؤثره توګه تنظیم کولو څرنګوالي پوهیدل د قوي او دقیق ماشین زده کړې ماډلونو رامینځته کولو لپاره خورا مهم دي.
په اړه نورې وروستۍ پوښتنې او ځوابونه EITC/AI/GCML د ګوګل بادل ماشین زده کړه:
- متن ته وینا (TTS) څه شی دی او دا څنګه د AI سره کار کوي؟
- د ماشین زده کړې کې د لوی ډیټاسیټونو سره کار کولو محدودیتونه څه دي؟
- ایا د ماشین زده کړه یو څه ډیالوژیکي مرسته کولی شي؟
- د TensorFlow د لوبې ډګر څه شی دی؟
- لوی ډیټاسیټ واقعیا څه معنی لري؟
- د الګوریتم د هایپرپرامیټرونو ځینې مثالونه څه دي؟
- د انسابل زده کړه څه ده؟
- څه که چیرې د ماشین زده کړې الګوریتم غوره نه وي او څنګه کولی شي ډاډ ترلاسه کړي چې سم انتخاب کړئ؟
- ایا د ماشین زده کړې ماډل د روزنې پرمهال څارنې ته اړتیا لري؟
- د عصبي شبکې پر بنسټ الګوریتم کې کارول شوي کلیدي پیرامیټونه کوم دي؟
نورې پوښتنې او ځوابونه په EITC/AI/GCML د ګوګل کلاوډ ماشین زده کړې کې وګورئ