žinios

„Dropbox“ apima teksto paiešką pdf dokumentuose ir vaizduose

Turinys:

Anonim

Antrą kartą per du mėnesius „ Dropbox “ patobulino savo paieškos sistemą, kad dabar galėtų ieškoti teksto PDF dokumentuose ir net vaizdo failų, tokių kaip PNG ar JPG.

„Dropbox“: raskite tai, ko norite, kur norite

Panašu, kad tokia yra „Dropbox“ - populiarios debesų saugojimo platformos, kuri pastaraisiais mėnesiais daugiausia dėmesio skyrė savo paieškos sistemos tobulinimui, prielaida. Praėjusį mėnesį bendrovė įdiegė naują mašininiu mokymu pagrįstą paieškos variklį ir dabar skelbia tobulinanti optinio simbolių atpažinimo (OCR) galimybes, leidžiančias vartotojams ieškoti teksto tiek PDF, tiek vaizdo failuose.

„Vaizdo formatai (tokie kaip JPEG, PNG ar GIF) paprastai nėra indeksuojami, nes neturi teksto turinio, o tekstiniai dokumentų formatai (tokie kaip TXT, DOCX ar HTML) paprastai yra indeksuojami. PDF failai paliekami viduryje, nes juose gali būti teksto ir vaizdo turinio mišinys. Automatinis vaizdo atpažinimas tekste gali protingai atskirti visus šiuos dokumentus, kad būtų galima suskirstyti į jame esančius duomenis.

Nepaisant gerų naujienų, šiuo metu šis naujas patobulinimas yra ribotas dviem aspektais. Viena vertus, atrodo, kad ji apsiriboja anglų kalba:

Taigi dabar, kai vartotojas atlieka angliško teksto paiešką, kuris pasirodo viename iš šių failų, jis bus rodomas paieškos rezultatuose.

Kita vertus, kaip Jon Porteris kolekcionuoja „The Verge“, funkcija apsiriboja brangiausiais prenumeratos lygiais.

Naujoji funkcija jau prieinama „Dropbox Business Advanced“ ir „Enterprise“ vartotojams, o artimiausiais mėnesiais ji turėtų būti prieinama profesionaliems „Dropbox“ abonentams.

Operacija yra panaši į technologiją, jau įdiegtą „Dropbox“ mobiliojoje programoje praėjusiais metais: naudojant programą dokumentui fotografuoti, bet tuo pačiu metu naudojant OCR, norint išgauti tekstą. Tačiau tai veikė tik su nedideliu dokumentų rinkiniu.

Įdiegę OCR galimybes tiesiogiai paieškos variklyje, „Dropbox“ dabar gali ieškoti teksto visuose jūsų PDF failuose ir vaizduose, nesvarbu, kaip jie buvo nuskaityti ar fotografuoti.

„Dropbox“ „The Verge“ šriftas

žinios

Pasirinkta redaktorius

Back to top button