د ګوګل ویژن API په کارولو سره د عکس څخه استخراج شوي متن ته لاسرسي لپاره ، تاسو کولی شئ یو لړ مرحلې تعقیب کړئ چې پکې د API د نظری کرکټر پیژندنې (OCR) وړتیاو کارول شامل دي. د ګوګل ویژن API کې د OCR ټیکنالوژي د لاسي لیکلو په شمول د عکسونو څخه د متن کشف او استخراج وړوي. دا فعالیت په ځانګړي ډول په غوښتنلیکونو کې ګټور دی چې د بصري معلوماتو کې موجود متني معلوماتو تحلیل او پوهیدو ته اړتیا لري.
لومړی، تاسو اړتیا لرئ د ګوګل ویژن API سره کار کولو لپاره اړین چاپیریال تنظیم کړئ. پدې کې د ګوګل کلاوډ کنسول کې د پروژې رامینځته کول ، د ویژن API فعالول ، او د اړتیا وړ تصدیق سندونه ترلاسه کول لکه د API کیلي یا د خدماتو حساب کیلي شامل دي.
یوځل چې ستاسو چاپیریال تنظیم شي ، تاسو کولی شئ د عکس فایل کې OCR ترسره کولو لپاره د Vision API د `asyncBatchAnnotateFiles` میتود څخه کار واخلئ. دا میتود تاسو ته اجازه درکوي د پروسس کولو لپاره د عکس فایلونو لیست تیر کړئ او پایلې په غیر متناسب ډول ترلاسه کړئ. په بدیل سره، تاسو کولی شئ د عکسونو لیست مستقیم پروسس کولو لپاره د `asyncBatchAnnotateImages` میتود وکاروئ.
د انځور څخه د متن استخراج لپاره، تاسو اړتیا لرئ د 'AnnotateImageRequest' څیز یوه بیلګه جوړه کړئ او مطلوب ځانګړتیاوې مشخص کړئ. په دې حالت کې، تاسو به د 'TEXT_DETECTION' ځانګړتیا وټاکئ ترڅو دا په ګوته کړي چې تاسو غواړئ له انځور څخه متن استخراج کړئ. تاسو کولی شئ اضافي پیرامیټونه هم مشخص کړئ لکه د ژبې اشاره د OCR دقت ښه کولو لپاره.
بیا ، تاسو اړتیا لرئ د عکس فایل په بیس 64 کوډ شوي تار کې کوډ کړئ او د کوډ شوي عکس ډیټا په کارولو سره د `انځور` څیز مثال رامینځته کړئ. دا 'انځور' اعتراض باید مخکې جوړ شوي 'AnnotateImageRequest' څیز کې اضافه شي.
د غوښتنې ترتیب کولو وروسته، تاسو کولی شئ دا د 'batchAnnotateImages' یا 'batchAnnotateFiles' میتود په کارولو سره ویژن API ته واستوئ، ستاسو د غوره شوي طریقې پورې اړه لري. API به عکس پروسس کړي او یو ځواب بیرته راوړي چې استخراج شوي متن لري.
د ځواب څخه استخراج شوي متن ته د لاسرسي لپاره، تاسو کولی شئ د 'AnnotateImageResponse' څیز د متن تشریحاتو ساحه تکرار کړئ. دا ساحه د `EntityAnnotation` شیانو لیست لري، هر یو په انځور کې د موندل شوي متن عنصر استازیتوب کوي. د هر `EntityAnnotation` څيز د وضاحت` ډګر استخراج شوی متن لري.
دلته په Python کې د کوډ نمونې مثال دی چې دا ښیې چې څنګه د ګوګل ویژن API په کارولو سره د عکس څخه استخراج شوي متن ته لاسرسی ومومئ:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
په دې مثال کې، د 'extract_text_from_image' فنکشن د ان پټ په توګه د عکس فایل ته لاره نیسي او د ویژن API ته د غوښتنې لیږلو لپاره د ګوګل کلاوډ ویژن پیرودونکي کتابتون کاروي. استخراج شوی متن بیا چاپ شوی.
د ګوګل ویژن API په کارولو سره د عکس څخه استخراج شوي متن ته د لاسرسي لپاره ، تاسو اړتیا لرئ چاپیریال تنظیم کړئ ، د مطلوب ځانګړتیاو سره د `AnnotateImageRequest` څیز رامینځته کړئ ، د عکس فایل کوډ کړئ ، API ته غوښتنه واستوئ ، او استخراج شوي متن بیرته ترلاسه کړئ. د ځواب څخه. د ویژن API د OCR وړتیاوې د لاسي لیکلو په ګډون د عکسونو څخه د متن کشف او استخراج وړوي.
په اړه نورې وروستۍ پوښتنې او ځوابونه د لاس لیکلو څخه د متن کشف او استخراج کول:
- کوم محدودیتونه رامینځته کیدی شي کله چې د ګوګل ویژن API په کارولو سره د پیچلو اسنادو څخه متن استخراج کړئ؟
- د ګوګل ویژن API د متن تفسیر کې د باور کچې اهمیت څه دی؟
- د ګوګل ویژن API څنګه کولی شي د لاس لیکل شوي نوټونو څخه متن په سمه توګه پیژني او استخراج کړي؟
- د لاس لیکل شوي عکسونو څخه د متن په موندلو او استخراج کې ننګونې څه دي؟
- ایا ګوګل ویژن د لاس لیکل پیژني؟