Ṣayẹwo ati OCR

O dara ọjọ

Boya kọọkan wa ni dojuko pẹlu iṣẹ-ṣiṣe nigba ti o ba nilo lati ṣe itumọ iwe-iwe iwe si ọna kika. Eyi jẹ pataki julọ fun awọn ti o ṣe iwadi, ṣiṣẹ pẹlu awọn iwe, ṣe itumọ awọn ọrọ nipa lilo awọn iwe itọnisọna itanna, bbl

Ninu àpilẹkọ yii Mo fẹ lati pin diẹ ninu awọn ipilẹ ilana yii. Ni apapọ, idanwo ati idanimọ ọrọ jẹ akoko ti o n gba, gẹgẹ bi awọn iṣẹ julọ yoo ni lati ṣe pẹlu ọwọ. A yoo gbiyanju lati ṣalaye kini, bi ati idi ti.

Ko gbogbo eniyan ni oye ohun kan lẹsẹkẹsẹ. Lẹhin ti aṣàwákiri (yẹ gbogbo awọn oju iwe lori iboju) iwọ yoo ni awọn aworan ti kika BMP, JPG, PNG, GIF (awọn ọna miiran le wa). Nitorina lati aworan yii o nilo lati gba ọrọ naa - ọna yii ni a npe ni idanimọ. Ni aṣẹ yii, ati pe yoo gbekalẹ ni isalẹ.

Awọn akoonu

  • 1. Kini o nilo fun idanwo ati idanimọ?
  • 2. Awọn aṣayan idanimọ ọrọ
  • 3. Idanimọ ọrọ ti iwe naa
    • 3.1 Ọrọ
    • 3.2 Awọn aworan
    • 3.3 Awọn tabili
    • 3.4 Awọn ohun ti ko ṣe pataki
  • 4. Ti idanimọ awọn faili faili PDF / DJVU
  • 5. Ṣiṣe ayẹwo aṣiṣe ati fifipamọ awọn iṣẹ iṣẹ

1. Kini o nilo fun idanwo ati idanimọ?

1) Iwoye

Lati ṣe awari awọn iwe ti a tẹjade sinu fọọmu ọrọ, akọkọ nilo scanner ati, gẹgẹbi, awọn eto "abinibi" ati awakọ ti o lọ pẹlu rẹ. Pẹlu wọn o le ṣayẹwo iboju naa ki o fi i pamọ fun ilọsiwaju siwaju sii.

O le lo awọn analogs miiran, ṣugbọn software ti o wa pẹlu scanner ni kit n ṣiṣẹ ni kiakia ati ni awọn aṣayan diẹ sii.

Ti o da lori iru iru iboju ti o ni - iyara iṣẹ le yato si pataki. Awọn scanners ti o le gba aworan kan lati inu iwe ni iṣẹju 10, awọn kan wa ti yoo gba ni ọgbọn-aaya. Ti o ba ṣawari iwe kan lori awọn oju iwọn 200-300 - Mo ro pe ko ṣoro lati ṣe iṣiro igba melo ni iyatọ yoo wa ni akoko?

2) Eto fun idanimọ

Ninu iwe wa, emi o fi iṣẹ naa han ọ ninu ọkan ninu awọn eto ti o dara ju fun gbigbọn ati pe o mọ gbogbo awọn iwe aṣẹ - ABBYY FineReader. Niwon eto naa ti san, lẹhinna ni kiakia Mo yoo fun ọna asopọ si ẹlomiiran - itọnisọna alailowaya ti Fọọmu Cunei. Otitọ, Emi kii ṣe afiwe wọn, nitori otitọ pe FineReader gba ni gbogbo ọna, Mo ṣe iṣeduro lati gbiyanju gbogbo rẹ.

ABBYY FineReader 11

Ibùdó ojula: //www.abbyy.ru/

Ọkan ninu awọn eto ti o dara julọ ti iru rẹ. O ti ṣe apẹrẹ lati ṣe akiyesi ọrọ inu aworan. Ti a ṣe ọpọlọpọ awọn aṣayan ati awọn ẹya ara ẹrọ. O le ṣe apepọ awọn lẹta pupọ, paapaa ṣe atilẹyin awọn ẹya ọwọ ọwọ (biotilejepe emi ko ṣe idanwo fun ara rẹ, Mo ro pe o dara lati koju iwe ti ọwọ ọwọ ayafi ti o ba ni ọwọ ọwọ calligraphic pipe). Alaye siwaju sii nipa ṣiṣẹ pẹlu rẹ ni ao sọ ni isalẹ. A tun ṣe akiyesi nibi pe akọọlẹ yoo bo iṣẹ naa ni awọn eto 11.

Bi ofin, awọn ẹya oriṣiriṣi ABBYY FineReader ko yatọ si ara wọn. O le ṣe awọn iṣọrọ kanna ni ẹlomiiran. Awọn iyatọ akọkọ le wa ni igbadun, iyara ti eto naa ati awọn agbara rẹ. Fun apere, awọn ẹya ti o ti kọja ṣii lati ṣi iwe PDF kan ati DJVU ...

3) Awọn iwe aṣẹ lati ọlọjẹ

Bẹẹni, nitorina nibi, Mo pinnu lati mu awọn iwe aṣẹ lọ ni iwe-iwe ọtọtọ. Ni ọpọlọpọ awọn igba miiran, ṣayẹwo eyikeyi awọn iwe-imọ, awọn iwe iroyin, awọn iwe ohun, awọn akọọlẹ, ati bẹbẹ lọ awọn iwe ati awọn iwe ti o wa ni ibere. Kini mo n ṣakoso si? Lati iriri ara ẹni, Mo le sọ pe Elo ti o fẹ ṣe ọlọjẹ - o le jẹ tẹlẹ lori apapọ! Igba melo ni Mo fi ara mi pamọ nigba ti mo ri iwe kan tabi omiiran ti a ti ṣayẹwo lori nẹtiwọki. Mo kan ni lati daakọ ọrọ naa sinu iwe naa ki o tẹsiwaju pẹlu rẹ.

Lati imọran imọran yii - ṣaaju ki o to ọlọjẹ ohun kan, ṣayẹwo boya ẹnikan ti ṣawari o tẹlẹ ati pe o ko nilo lati ṣafo akoko rẹ.

2. Awọn aṣayan idanimọ ọrọ

Nibi, Emi kii yoo sọ nipa awọn awakọ rẹ fun scanner, awọn eto ti o lọ pẹlu rẹ, nitori gbogbo awọn awoṣe scanner jẹ oriṣiriṣi, software tun yatọ si ibi gbogbo ati labaro ati paapaa fihan kedere bi o ṣe ṣe iṣẹ naa jẹ otitọ.

Ṣugbọn gbogbo awọn scanners ni awọn eto kanna ti o le ni ipa pupọ lori iyara ati didara iṣẹ rẹ. Nibi nipa wọn Emi yoo sọrọ nibi. Mo ti ṣe akojọ ni ibere.

1) Iwọn ayẹwo - DPI

Akọkọ, ṣeto didara ọlọjẹ ni awọn aṣayan ko din ju DPI 300. O ni imọran lati ani fi diẹ sii diẹ, ti o ba ṣee ṣe. Ti o ga ni itọka DPI jẹ, fifi aworan rẹ han yoo tan jade, ati bẹ, ṣiṣe siwaju sii yoo waye ni kiakia. Pẹlupẹlu, ti o ga didara didara ọlọjẹ naa - awọn aṣiṣe ti o kere ju ti o ṣe atunṣe.

Aṣayan ti o dara julọ n pese, nigbagbogbo DPI 300-400.

2) iyatọ

Yiyi pataki yoo ni ipa lori akoko ọlọjẹ (nipasẹ ọna, DPI tun ni ipa, ṣugbọn wọn lagbara, ati pe nigbati olumulo ba ṣeto awọn ipo to gaju).

Maa ni awọn ọna mẹta:

- dudu ati funfun (pipe fun ọrọ kedere);

- grẹy (o dara fun ọrọ pẹlu awọn tabili ati awọn aworan);

- awọ (fun awọn iwe-akọọlẹ awọ, awọn iwe, ni apapọ, awọn iwe aṣẹ, ibiti awọ jẹ pataki).

Nigbagbogbo akoko ọlọjẹ da lori ori ti o fẹ. Lẹhinna, ti o ba ni iwe nla kan, ani awọn afikun iṣẹju 5-10 si oju-iwe bi pipe kan yoo ja si akoko ti o tọ ...

3) Awọn fọto

O le gba iwe-aṣẹ naa kii ṣe nipasẹ gbigbọn, ṣugbọn nipasẹ gbigba aworan kan ti o. Bi ofin, ninu ọran yii o ni awọn iṣoro miiran: idinku aworan, iṣoro. Nitori eyi, o le nilo ilọsiwaju siwaju sii siwaju ati processing ti ọrọ ti a gba. Tikalararẹ, Emi ko ṣe iṣeduro lilo awọn kamẹra fun iṣowo yii.

O ṣe pataki lati ṣe akiyesi pe kii ṣe gbogbo iru iwe bẹẹ ni ao mọ, nitori ọlọjẹ didara o le jẹ lalailopinpin kekere ...

3. Idanimọ ọrọ ti iwe naa

A ro pe awọn oju-ewe ti o ṣawari ti ṣalaye ti o gba. Ni ọpọlọpọ igba wọn jẹ ọna kika: Tif, B, jpg, png. Ni gbogbogbo, fun ABBYY FineReader - eleyi ko ṣe pataki ...

Lẹhin ti nsii aworan naa ni ABBYY FineReader, eto naa, bi ofin, lori ẹrọ naa bẹrẹ lati yan agbegbe ati ki o da wọn mọ. Ṣugbọn nigbami o ṣe pe o tọ. Fun eyi a ṣe akiyesi aṣayan awọn agbegbe ti o fẹ pẹlu ọwọ.

O ṣe pataki! Ko gbogbo eniyan ni o mọ pe lẹhin ti o ṣii iwe kan ninu eto naa, ni apa osi ni window ni orisun orisun ti han, ninu eyiti o ṣe afihan awọn agbegbe ọtọtọ. Lẹhin ti tẹ lori bọtini "idanimọ," eto naa ni window ni apa otun yoo mu ọrọ ti o ti pari. Lẹhin ti idanimọ, nipasẹ ọna, o ni imọran lati ṣayẹwo ọrọ fun awọn aṣiṣe ni kanna BeatReader.

3.1 Ọrọ

Agbegbe yii ni a lo lati saami ọrọ. Awọn aworan ati awọn tabili yẹ ki o yọ kuro lati inu rẹ. Awọn iwewe ati awọn lẹta ti o ni idiwọn yoo ni titẹ pẹlu ọwọ ...

Lati yan agbegbe ọrọ kan, fiyesi si panamu ni oke FineReader. Bọtini "T" kan wa (wo. Awọn sikirinifoto ni isalẹ, awọn idubusi oju-opo ni o wa lori bọtini yi). Tẹ lori rẹ, lẹhinna ninu aworan ni isalẹ yan agbegbe ti ko ni ẹẹgbẹ to wa ninu eyiti ọrọ naa wa. Nipa ọna, ni awọn igba miiran o nilo lati ṣẹda awọn bulọọki ọrọ ti 2-3, ati nigbakanna 10-12 nipasẹ oju-iwe, nitori Ikọ ọrọ le jẹ oriṣiriṣi ati pe ko yan gbogbo agbegbe pẹlu ọkan onigun mẹta.

O ṣe pataki lati ṣe akiyesi pe awọn aworan ko yẹ ki o ṣubu sinu agbegbe ọrọ naa! Ni ojo iwaju, yoo gba ọ ni ọpọlọpọ igba ...

3.2 Awọn aworan

Ti a lo lati ṣe afihan awọn aworan ati awọn agbegbe ti o ṣoro lati dahun nitori didara ko dara tabi awoṣe ti o yatọ.

Ni iboju sikirinifoto ni isalẹ, awọn idubẹkun Ikọrin wa lori bọtini ti a lo lati yan aaye "aworan". Nipa ọna, Eda eyikeyi apakan ti oju-iwe yii ni a le yan ni agbegbe yii, ati FineReader yoo fi sii sinu iwe naa gẹgẹbi aworan deede. Ie o kan "aṣiwere" yoo daakọ ...

Ni igbagbogbo, a lo agbegbe yi lati ṣafihan awọn tabili ti a koju, lati ṣe afihan ọrọ aiṣedeede ati aifọwọyi, awọn aworan ara wọn.

3.3 Awọn tabili

Awọn sikirinifoto ni isalẹ fihan bọtini lati saami awọn tabili. Ni gbogbogbo, Mo tikalararẹ lo o gidigidi. Otitọ ni pe iwọ ni lati fa (kosi) kọọkan ila lori tabili ki o fihan ohun ati bi eto naa ṣe jẹ. Ti tabili jẹ kekere ati pe ko dara pupọ, Mo ṣe iṣeduro nipa lilo aaye "aworan" fun awọn idi wọnyi. Nitorina n gba igba pipọ pamọ, lẹhinna o le ṣe tabili ni kiakia ni Ọrọ lori ipilẹ aworan.

3.4 Awọn ohun ti ko ṣe pataki

O ṣe pataki lati ṣe akiyesi. Nigba miran awọn ohun elo ti ko ni dandan ni oju iwe ti o jẹ ki o nira lati da ọrọ naa mọ, tabi ko jẹ ki o yan agbegbe ti o fẹ naa ni gbogbo. Wọn le yọ kuro nipa lilo "eraser" ni gbogbo.

Lati ṣe eyi, lọ si ipo atunṣe aworan.

Yan ohun elo eraser ati yan agbegbe ti a kofẹ. O yoo parẹ ati ni ipo rẹ yoo jẹ iwe ti funfun.

Nipa ọna, Mo ṣe iṣeduro lilo aṣayan yi fun ọ ni igbagbogbo bi o ti ṣee. Gbiyanju gbogbo awọn aaye ọrọ ti o yan, nibi ti o ko nilo ọrọ kan, tabi awọn ọrọ ti ko ni dandan, ibanujẹ, awọn idẹ - paarẹ pẹlu eraser. O ṣeun si idanimọ yii yoo jẹ yiyara!

4. Ti idanimọ awọn faili faili PDF / DJVU

Ni gbogbogbo, ọna kika yi ko ni yatọ si awọn miiran - ie. O le ṣiṣẹ pẹlu rẹ gẹgẹbi pẹlu awọn aworan. Nikan ohun ti eto naa ko yẹ ki o jẹ ti atijọ ti ikede, ti o ko ba ṣii PDF / DJVU awọn faili - mu ikede naa pada si 11.

Ibere ​​imọran diẹ. Lẹhin ti ṣiṣi iwe naa ni FineReader - yoo bẹrẹ laifọwọyi lati da iwe naa mọ. Nigbagbogbo ni awọn faili PDF / DJVU, agbegbe kan ti oju-iwe ko ni nilo jakejado iwe gbogbo! Lati yọ iru agbegbe bayi lori gbogbo awọn oju-iwe, ṣe awọn atẹle:

1. Lọ si apakan atunṣe aworan.

2. Ṣiṣe aṣayan aṣayan "trimming".

3. Yan agbegbe ti o nilo lori gbogbo awọn oju-iwe.

4. Tẹ waye si gbogbo oju-iwe ati ki o gee.

5. Ṣiṣe ayẹwo aṣiṣe ati fifipamọ awọn iṣẹ iṣẹ

O dabi pe awọn iṣoro tun le wa nigbati gbogbo awọn agbegbe ba yan, lẹhinna mọ - gba o ki o si fipamọ ... Ko ṣe wa nibẹ!

Akọkọ, a nilo lati ṣayẹwo iwe naa!

Lati ṣe ilọsiwaju, lẹhin ti idanimọ, ni window ni apa otun, yoo jẹ bọtini "ṣayẹwo", wo ifaworanhan ni isalẹ. Lẹhin ti o tẹ ọ, eto FineReader yoo fihan ọ ni awọn agbegbe nibiti eto naa ni awọn aṣiṣe ati pe ko le gbẹkẹle aami kan tabi aami miiran. O yoo ni lati yan, tabi o gba pẹlu ero ti eto naa, tabi tẹ ọrọ rẹ sii.

Nipa ọna, ni idaji awọn oran, to fẹrẹ, eto naa yoo fun ọ ni ọrọ ọtun ti a ti ṣetan - o kan ni lati lo Asin lati yan aṣayan ti o fẹ.

Keji, lẹhin ti ṣayẹwo o nilo lati yan ọna kika ti o fi ipamọ iṣẹ rẹ silẹ.

Nibi FineReader n fun ọ ni iyipada si kikun: o le gbe alaye ni kiakia ni Ọrọ-ọrọ ọkan, ati pe o le fipamọ ni ọkan ninu awọn ọna kika pupọ. Ṣugbọn Emi yoo fẹ lati ṣafasi si abala miiran pataki. Eyikeyi kika ti o yan, o ṣe pataki ju lati yan iru ẹda naa! Wo awọn aṣayan ti o wuni julọ ...

Duro deede

Gbogbo awọn agbegbe ti o yan lori oju-iwe ni iwe ti a mọ ti yoo baamu gangan ni iwe orisun. Aṣayan rọrun pupọ nigba ti o ṣe pataki fun o ko padanu kika akoonu. Nipa ọna, awọn nkọwe yoo tun jẹ iru kanna si atilẹba. Mo ṣe iṣeduro pẹlu aṣayan yi lati gbe iwe si Ọrọ, lati tẹsiwaju iṣẹ siwaju sii nibẹ.

Idaako ti a da sile

Aṣayan yii jẹ dara nitori pe o gba ẹya ti a ti sọ tẹlẹ ti ọrọ naa. Ie Itọsi ti "kilomita", eyi ti o le wa ninu iwe atilẹba - iwọ kii yoo pade. Aṣayan anfani nigba ti iwọ yoo ṣe atunṣe alaye naa daradara.

Otitọ, o yẹ ki o ko yan boya o ṣe pataki fun ọ lati tọju ara ti awọn apẹrẹ, awọn lẹta, awọn alaiṣẹ. Nigba miran, ti o ba jẹ pe idanimọ naa ko ni aṣeyọri - iwe rẹ le "skew" nitori iyipada ti o yipada. Ni idi eyi, o ni imọran lati yan gangan gangan.

Ọrọ atokọ

Aṣayan fun awọn ti o nilo kan ọrọ naa lati oju-iwe laisi ohun gbogbo. Dara fun awọn iwe laisi awọn aworan ati awọn tabili.

Eyi pari ọrọ idanimọ iwe ati idanimọ nkan. Mo nireti pe pẹlu iranlọwọ ti awọn itọnisọna rọrun wọnyi o le yanju awọn iṣoro rẹ ...

Orire ti o dara!