doctr for scanned pdf #1614

InesBenAmor99 · 2024-05-13T21:02:10Z

I have doctr installed , When I upload a photo, it works very well and extracts text perfectly. However, when I upload a scanned PDF, it keeps processing for a very long time without any response or error. What could be missing?

it works also with a scanned pdf but : for exemple first page is not scanned (contains title or a sentence etc) and all the next pages are scanned , it extracts text from all the pages perfectly , but when the whole pdf is scanned it keeps processing without response.

pseudotensor · 2024-05-14T01:16:17Z

By default docTR isn't used if many pages for PDF. It's possible it's using OCR (unstructured package) instead. Can you tell from the command line? I would disable unstructured and OCR from expert panel in UI and try again. You can disable via CLI as well.

pymupdf is the default loader, unless the PDF is all (by pages) a scanned image based PDF, then it will revert progressively to other backup methods.

i.e. it does in order:

pymupdf
pypdf
unstructured pdf
OCR based unstructured pdf
DocTR
As html instead of pdf in case file extension is wrong.

With CLI, you can disable everything except DocTR and see how goes. Then narrow down which thing is taking time. If it's many pages, DocTR does take some time, but I've seen OCR from unstructured take too long and even much longer and worse quality.

Also if you have a PDF that you can share that shows the issue, I'm happy to look. If you need to keep it semi-private, you can email me at jon.mckinney@h2o.ai.

InesBenAmor99 · 2024-05-14T10:19:16Z

Hello, thank you for responding. Actually, it's not for a specific PDF as mentioned. In general, if the PDF contains a title or something similar that is not scanned, and all the subsequent pages are scanned, it extracts , doctr works and extract text from the entire file. If the whole PDF is scanned, it continues processing without a response. I'm showing you an example in this video: The first document contains 7 pages. The first page contains a title that is not scanned, and the next 6 pages are all scanned. However, the tool extracts text from all pages (I can verify this through the document viewer ==> view database text). The second document is the document "image_based_pdf_sample" found in the test folder in h2ogpt, which is similar to my problematic documents. As you can see, it continues processing without responding. I shortened the video so I could share it here, but it's still processing, as shown in the screenshot.

testing-doctr_6BSPCc9W.mp4

pseudotensor · 2024-05-14T14:42:24Z

Can you do two things?

Add --verbose to he CLI options
do ps -auxwf |grep -A 5 -B 5 generate and share to see what is running.
When it's stuck, do kill -s SIGUSR1 for the that is the "generate.py" pid from above or a deeper fork (lower in list below generate in tree) and share the full output that goes to console. It will include many threads and that may show where it's stuck.

pseudotensor · 2024-05-14T15:48:07Z

Also, can you try gpt.h2o.ai -- do you have similar issues? This will help identify if it is an installation or computer issue.

InesBenAmor99 · 2024-05-17T12:42:13Z

Honestly, I didn't get the steps mentioned as I'm on a Windows VM, so I think the equivalent is to check running processes? But I'm sharing with you what is happening when I run with --verbose.

for a whole scanned pdf ( only doctr option is selected ) :
for a pdf that containts a title that is not scanned and all other pages scanned :

OTHER THING : that when i upolad the same whole scanned pdf without selecting doctr option i got this error
0 [main] python (3368) C:\Users\Ines_Ben_Amor\miniconda3\envs\h2ogpt\python.exe: *** fatal error - Internal error: TP_NUM_C_BUFS too small: 50
Stack trace:
Frame Function Args
007D0AA07AE0 00021005FE8E (00021029B0CB, 00021026AB81, 000210314220, 007D0AA05400) msys-2.0.dll+0x1FE8E
007D0AA07AE0 0002100467F9 (02254D95B100, 02254D95B150, 000000000012, 02254D95B150) msys-2.0.dll+0x67F9
007D0AA07AE0 000210046832 (000000000032, 0000000010A1, 000210314220, 0010000004C0) msys-2.0.dll+0x6832
007D0AA07AE0 0002100E45FF (02254D95B180, 02254D95B100, 02254D95B0F0, 000000000012) msys-2.0.dll+0xA45FF
007D0AA07AE0 000210096063 (7FF84D462DF3, 000000000000, 000210314220, 001000000010) msys-2.0.dll+0x56063
007D0AA07AE0 00021005813C (000000000001, 000000000030, 000000000000, 001000000010) msys-2.0.dll+0x1813C
007D0AA07AE0 0002100D4B6E (000000000001, 000000000016, 0010000003E0, 022402350486) msys-2.0.dll+0x94B6E
007D0AA07AE0 000210193F2B (000000000001, 000000000016, 0010000003E0, 022402350486) msys-2.0.dll+0x153F2B
007D0AA07AE0 02240233215C (02243EEFEC48, 000000000006, 007D0AA07A28, 007D0AA07AF0) msys-magic-1.dll+0x215C
007D0AA07AE0 022402336947 (000000000000, 000000000001, 7FF81049362B, 007D0AA07B10) msys-magic-1.dll+0x6947
007D0AA07AE0 7FF825BF4541 (00000000000A, 007D0AA07D30, 7FF825BF4262, 000000000000) ffi-8.dll+0x4541
007D0AA07B10 7FF825BF4332 (000000000002, 02240A489320, 007D0AA07D70, 000000000000) ffi-8.dll+0x4332
007D0AA07D70 7FF825BF4212 (7FF81048DFF7, 02254DA33600, 02240A489320, 007D0AA07D10) ffi-8.dll+0x4212
007D0AA07D70 7FF82511B41F (0224023319F0, 007D0AA07D20, 000000000000, 022400000000) _ctypes.pyd+0xB41F
007D0AA07D70 7FF82511BE3E (02254DA38930, 02254DA38520, 000000000000, 007D00001101) _ctypes.pyd+0xBE3E
000000000002 7FF825116958 (02254DA37A00, 000000000000, 022400000000, 02254DA370A0) _ctypes.pyd+0x6958
000000000000 7FF8104ADEE8 (007D0AA08030, 0224D1C09630, 0224D1C09630, 000000000000) python310.dll+0x10DEE8
007D0AA08030 7FF8105B6B12 (7FF81080A140, 007D0AA08030, 0224432C72B0, 000000000000) python310.dll+0x216B12
007D0AA08030 7FF8105B2A18 (02254DA1F800, 02254DA1F800, 007D0AA08128, 000000000001) python310.dll+0x212A18
000000000043 7FF8105B5214 (02254DA1F7F0, 02254D6F7448, 0224C504E0A0, 000000000001) python310.dll+0x215214
007D0AA082B0 7FF8104AE29E (000087EB29E6, 02243F594F30, 0000000000A0, 02254DA44A00) python310.dll+0x10E29E
007D0AA082B0 7FF8105AE541 (02254D6F7450, 022591C1260A, 02254D6F72E0, 000000000000) python310.dll+0x20E541
007D0AA082B0 7FF8105B6B12 (02254DA408B0, 007D0AA082B0, 007D0AA082B0, 000000000000) python310.dll+0x216B12
007D0AA082B0 7FF8105B2FFD (007D0AA083A0, 007D0AA083A0, 7FF8105B0219, 000000000000) python310.dll+0x212FFD
000000000040 7FF8105B5214 (02254DA367C0, 02254DA367C0, 7FF81080EB90, 000000000000) python310.dll+0x215214
02254DA3C5B0 7FF8105AFEE2 (02243F53BD40, 02254DA3C5B0, 000000000010, 00001B000219) python310.dll+0x20FEE2
02243F53BD40 7FF8105AAEBE (02243F5350D0, 02243EEC0000, 02243EEC0000, 000000000000) python310.dll+0x20AEBE
02254DA37918 7FF8105A8888 (7FF810809AC0, 02240A489320, 02243F5350D0, 02240A489320) python310.dll+0x208888
02254DA37918 7FF8104F20F9 (007D0AA085F0, 02243F5350D0, 02254D6F7CE0, 0000000000A4) python310.dll+0x1520F9
007D0AA085F0 7FF8105B6DEC (02254DA36640, 007D0AA08620, 02254DA37908, 02254DA36700) python310.dll+0x216DEC
007D0AA08620 7FF8105B1E04 (02243F5015B0, 02243F5015B0, 02254DA323E0, 000000000003) python310.dll+0x211E04
00000000004F 7FF8105B5214 (02243F5015A0, 022520D6BB88, 7FF810809AC0, 000000000003) python310.dll+0x215214
End of stack trace (more stack frames may be present)
Loaded modules:
7FF7BF570000 python.exe
7FF84D440000 ntdll.dll
7FF84BD30000 KERNEL32.DLL
7FF84AFD0000 KERNELBASE.dll
7FF84A9C0000 ucrtbase.dll
7FF83FB80000 VCRUNTIME140.dll
7FF8103A0000 python310.dll
7FF84C670000 WS2_32.dll
7FF84CCA0000 RPCRT4.dll
7FF84BC60000 ADVAPI32.dll
7FF84D210000 msvcrt.dll
7FF84D2D0000 sechost.dll
7FF840230000 VERSION.dll
7FF83F070000 zlib.dll
7FF84AD50000 bcrypt.dll
7FF84A120000 CRYPTSP.dll
7FF849A30000 rsaenh.dll
7FF84A140000 CRYPTBASE.dll
7FF84AB70000 bcryptPrimitives.dll
02243F0B0000 python3.DLL
7FF8479C0000 _queue.pyd
7FF845500000 _uuid.pyd
7FF845460000 _hashlib.pyd
7FF80E690000 libcrypto-3-x64.dll
7FF84ABF0000 CRYPT32.dll
7FF84B8B0000 USER32.dll
7FF84B340000 win32u.dll
7FF84B5C0000 GDI32.dll
7FF84AD80000 gdi32full.dll
7FF84AAD0000 msvcp_win.dll
7FF84B430000 IMM32.DLL
7FF825A00000 _socket.pyd
7FF849C10000 IPHLPAPI.DLL
7FF83F060000 select.pyd
7FF8259D0000 _ssl.pyd
7FF81E6E0000 libssl-3-x64.dll
7FF82B210000 _bz2.pyd
7FF8258D0000 LIBBZ2.dll
7FF82B1E0000 _lzma.pyd
7FF825180000 liblzma.dll
7FF824AA0000 _brotli.cp310-win_amd64.pyd
7FF81E5C0000 unicodedata.pyd
7FF825140000 _cffi_backend.cp310-win_amd64.pyd
7FF825110000 _ctypes.pyd
7FF84BB20000 ole32.dll
7FF84CEA0000 combase.dll
7FF84CDC0000 OLEAUT32.dll
7FF825BF0000 ffi-8.dll
7FF8250F0000 _asyncio.pyd
7FF8259C0000 _overlapped.pyd
7FF849ED0000 mswsock.dll
7FF84BF10000 shell32.DLL
7FF824990000 _decimal.pyd
7FF80BD40000 _pydantic_core.cp310-win_amd64.pyd
7FF820E60000 backend_c.cp310-win_amd64.pyd
7FF825960000 md.cp310-win_amd64.pyd
7FF824A70000 md__mypyc.cp310-win_amd64.pyd
7FF824C90000 _sqlite3.pyd
7FF815CC0000 sqlite3.dll
7FF825880000 _mklinit.cp310-win_amd64.pyd
7FF806CE0000 mkl_rt.2.dll
7FF821CF0000 _py_mkl_service.cp310-win_amd64.pyd
7FF8026D0000 mkl_intel_thread.2.dll
7FFFEB5F0000 mkl_core.2.dll
7FF814E50000 _multiarray_umath.cp310-win_amd64.pyd
7FF81E5A0000 _multiarray_tests.cp310-win_amd64.pyd
7FF81E580000 _umath_linalg.cp310-win_amd64.pyd
7FF81E440000 _pocketfft_internal.cp310-win_amd64.pyd
7FF8166C0000 mtrand.cp310-win_amd64.pyd
7FF817470000 bit_generator.cp310-win_amd64.pyd
7FF8171A0000 _common.cp310-win_amd64.pyd
7FF815C70000 _bounded_integers.cp310-win_amd64.pyd
7FF81C0A0000 _mt19937.cp310-win_amd64.pyd
7FF817020000 _philox.cp310-win_amd64.pyd
7FF817000000 _pcg64.cp310-win_amd64.pyd
7FF8253D0000 _sfc64.cp310-win_amd64.pyd
7FF815BC0000 _generator.cp310-win_amd64.pyd
7FF800170000 mkl_def.2.dll
7FF80B4A0000 mkl_vml_def.2.dll
7FF8250E0000 _multiprocessing.pyd
7FF8153C0000 interval.cp310-win_amd64.pyd
7FF814360000 hashtable.cp310-win_amd64.pyd
7FF8168E0000 missing.cp310-win_amd64.pyd
7FF8166A0000 dtypes.cp310-win_amd64.pyd
7FF8164D0000 np_datetime.cp310-win_amd64.pyd
7FF815B90000 conversion.cp310-win_amd64.pyd
7FF824A60000 base.cp310-win_amd64.pyd
7FF815B60000 nattype.cp310-win_amd64.pyd
7FF8159D0000 tzconversion.cp310-win_amd64.pyd
7FF8159A0000 timezones.cp310-win_amd64.pyd
7FF821CC0000 _zoneinfo.pyd
022443EA0000 tzres.dll
7FF815870000 parsing.cp310-win_amd64.pyd
7FF8142C0000 offsets.cp310-win_amd64.pyd
7FF815360000 timedeltas.cp310-win_amd64.pyd
7FF814E10000 fields.cp310-win_amd64.pyd
7FF81E570000 ccalendar.cp310-win_amd64.pyd
7FF814250000 timestamps.cp310-win_amd64.pyd
7FF81E430000 properties.cp310-win_amd64.pyd
7FF814200000 period.cp310-win_amd64.pyd
7FF815840000 vectorized.cp310-win_amd64.pyd
7FF817280000 ops_dispatch.cp310-win_amd64.pyd
7FF80F5A0000 algos.cp310-win_amd64.pyd
7FF8139C0000 lib.cp310-win_amd64.pyd
7FF8141C0000 tslib.cp310-win_amd64.pyd
7FF814DE0000 hashing.cp310-win_amd64.pyd
7FF80B180000 lib.cp310-win_amd64.pyd
7FF813330000 MSVCP140.dll
7FF80DA10000 arrow_python.dll
7FFFE9670000 arrow.dll
7FF816580000 VCRUNTIME140_1.dll
7FF849FD0000 USERENV.dll
7FF822660000 WININET.dll
7FF843F70000 WINHTTP.dll
7FF83D650000 Secur32.dll
7FF84A240000 ncrypt.dll
7FF84A3C0000 SSPICLI.DLL
7FF84A200000 NTASN1.dll
7FF813990000 ops.cp310-win_amd64.pyd
7FF813300000 interpreter.cp310-win_amd64.pyd
7FF849360000 kernel.appcore.dll
7FF812A40000 _compute.cp310-win_amd64.pyd
7FF8164B0000 arrays.cp310-win_amd64.pyd
7FF810330000 index.cp310-win_amd64.pyd
7FF80D4E0000 join.cp310-win_amd64.pyd
7FF80F4E0000 sparse.cp310-win_amd64.pyd
7FF815350000 reduction.cp310-win_amd64.pyd
7FF8141B0000 indexing.cp310-win_amd64.pyd
7FF8132C0000 internals.cp310-win_amd64.pyd
7FF812A10000 writers.cp310-win_amd64.pyd
7FF80E640000 aggregations.cp310-win_amd64.pyd
7FF80FB40000 indexers.cp310-win_amd64.pyd
7FF80E570000 reshape.cp310-win_amd64.pyd
7FF80E530000 strptime.cp310-win_amd64.pyd
7FF80AFF0000 groupby.cp310-win_amd64.pyd
7FF8129F0000 testing.cp310-win_amd64.pyd
7FF80DFA0000 parsers.cp310-win_amd64.pyd
7FF80F4C0000 json.cp310-win_amd64.pyd
7FF813F90000 _version.cp310-win_amd64.pyd
7FF80E500000 _frame.cp310-win_amd64.pyd
7FF80E620000 _psutil_windows.pyd
7FF84D2C0000 PSAPI.DLL
7FF84A890000 POWRPROF.dll
7FF83C730000 pdh.dll
7FF84A870000 UMPDC.dll
7FF847720000 wtsapi32.dll
7FF80DCA0000 _elementtree.pyd
7FF80DC60000 pyexpat.pyd
7FF80DC00000 gobject-2.0-0.dll
7FF80CCC0000 glib-2.0-0.dll
7FF80DBC0000 intl-8.dll
7FF80D3F0000 iconv.dll
7FF80AF60000 pcre2-8.dll
7FF80FB30000 charset.dll
7FF80AF00000 pango-1.0-0.dll
7FF80D9F0000 fribidi-0.dll
7FF80AD70000 gio-2.0-0.dll
7FF80AC60000 harfbuzz.dll
7FF84B370000 SHLWAPI.dll
7FF80D9D0000 USP10.dll
7FF80ABB0000 freetype.dll
7FF80D3C0000 graphite2.dll
7FF80F4B0000 gmodule-2.0-0.dll
7FF849C40000 DNSAPI.dll
7FF80AB70000 libpng16.dll
7FF84BA80000 NSI.dll
7FF80AB20000 fontconfig-1.dll
7FF80AAB0000 libexpat.dll
7FF80CCA0000 pangoft2-1.0-0.dll
7FF80AA40000 bezierTools.cp310-win_amd64.pyd
7FF80DBB0000 shfolder.dll
7FF841FF0000 windows.storage.dll
7FF84B7C0000 SHCORE.dll
7FF80A9D0000 _imaging.cp310-win_amd64.pyd
7FF80A970000 openjp2.dll
7FF80A8F0000 tiff.dll
7FF80A820000 jpeg8.dll
7FF80A7E0000 deflate.dll
7FF80A730000 zstd.dll
7FF80A6A0000 Lerc.dll
7FF80A2B0000 etree.cp310-win_amd64.pyd
7FF80A280000 _elementpath.cp310-win_amd64.pyd
7FF80A250000 iup.cp310-win_amd64.pyd
7FF80A1F0000 asmjit.dll
7FF809FD0000 c10.dll
7FF835FC0000 dbghelp.dll
7FF809F60000 c10_cuda.dll
7FF806C50000 cudart64_110.dll
7FF80CC90000 caffe2_nvrtc.dll
7FFFE6F00000 nvrtc64_112_0.dll
7FFFE1A50000 cublas64_11.dll
7FFFACE80000 cublasLt64_11.dll
7FF80D670000 nvcuda.dll
7FF809F10000 cudnn64_8.dll
7FF848C50000 uxtheme.dll
7FFFD9DA0000 cudnn_adv_infer64_8.dll
7FFFA7260000 cudnn_ops_infer64_8.dll
7FF84BE60000 clbcatq.dll
7FFF9FE00000 cudnn_adv_train64_8.dll
7FFFD0060000 cudnn_ops_train64_8.dll
7FFF72CE0000 cudnn_cnn_infer64_8.dll
000010000000 zlibwapi.dll
7FFF9A2A0000 cudnn_cnn_train64_8.dll
7FFF61F50000 cufft64_10.dll
7FF806C00000 cufftw64_10.dll
7FF8067D0000 cupti64_2022.3.0.dll
7FFF5DAB0000 curand64_10.dll
7FFF4BDF0000 cusolver64_11.dll
7FFF41040000 cusolverMg64_11.dll
7FFF30790000 cusparse64_11.dll
7FFFD9490000 fbgemm.dll
7FF806220000 libiomp5md.dll
7FF809F00000 libiompstubs5md.dll
7FFFD8CF0000 nvrtc-builtins64_118.dll
7FF809EF0000 nvToolsExt64_1.dll
7FF806760000 shm.dll
7FFED9290000 torch_cpu.dll
7FFFD8540000 uv.dll
7FFEE86A0000 torch_cuda.dll
7FF806750000 torch.dll
7FF806740000 torch_global_deps.dll
7FFFD7690000 torch_python.dll
7FF806730000 _C.cp310-win_amd64.pyd
7FF845EB0000 mrmcorer.dll
7FF840270000 iertutil.dll
7FF83FC80000 windows.staterepositorycore.dll
7FF84A8F0000 profapi.dll
7FF847E40000 bcp47mrm.dll
7FF84A5D0000 CFGMGR32.dll
7FF846C70000 propsys.dll
7FF806720000 _c_internal_utils.cp310-win_amd64.pyd
7FF8066F0000 _path.cp310-win_amd64.pyd
7FF805BC0000 msvcp140-456d948669199b545d061b84c160bebc.dll
7FF8000D0000 ft2font.cp310-win_amd64.pyd
7FF806650000 _cext.cp310-win_amd64.pyd
7FF806620000 _image.cp310-win_amd64.pyd
7FFED4AA0000 cv2.pyd
7FF821AF0000 MFPlat.DLL
7FF8066E0000 WSOCK32.dll
7FFFD7570000 MFReadWrite.dll
7FF82F3C0000 MF.dll
7FF8220F0000 MFCORE.DLL
7FF848AE0000 RTWorkQ.DLL
7FF806200000 _ccallback_c.cp310-win_amd64.pyd
7FFFD7160000 _sparsetools.cp310-win_amd64.pyd
7FF800030000 _csparsetools.cp310-win_amd64.pyd
7FF8061B0000 _iterative.cp310-win_amd64.pyd
7FFFD52A0000 libopenblas_v0.3.20-571-g3dec11c6-gcc_10_3_0-c2315440d6b6cef5037bad648efc8c59.dll
7FFFD8C40000 _fblas.cp310-win_amd64.pyd
7FFFD5080000 _flapack.cp310-win_amd64.pyd
7FFFD5000000 _cythonized_array_utils.cp310-win_amd64.pyd
7FFFD4F70000 cython_lapack.cp310-win_amd64.pyd
7FF805B70000 _solve_toeplitz.cp310-win_amd64.pyd
7FFFD4F30000 _decomp_lu_cython.cp310-win_amd64.pyd
7FFFD4EF0000 _matfuncs_sqrtm_triu.cp310-win_amd64.pyd
7FFFD4E80000 _matfuncs_expm.cp310-win_amd64.pyd
7FFFD4E30000 cython_blas.cp310-win_amd64.pyd
7FFFD4DD0000 _decomp_update.cp310-win_amd64.pyd
7FF800010000 _flinalg.cp310-win_amd64.pyd
7FFFD4D60000 _superlu.cp310-win_amd64.pyd
7FFFD4C90000 _arpack.cp310-win_amd64.pyd
7FFFD4C20000 _shortest_path.cp310-win_amd64.pyd
7FFFD4BF0000 _tools.cp310-win_amd64.pyd
7FFFD4B60000 _traversal.cp310-win_amd64.pyd
7FFFD4B20000 _min_spanning_tree.cp310-win_amd64.pyd
7FFFD4AD0000 _flow.cp310-win_amd64.pyd
7FFFD4A80000 _matching.cp310-win_amd64.pyd
7FFFD4A30000 _reordering.cp310-win_amd64.pyd
7FFFD4A10000 _minpack2.cp310-win_amd64.pyd
7FFFD4900000 _group_columns.cp310-win_amd64.pyd
7FFFD48A0000 _trlib.cp310-win_amd64.pyd
7FFFD4880000 messagestream.cp310-win_amd64.pyd
7FFFCFFE0000 _lbfgsb.cp310-win_amd64.pyd
7FFFCFFB0000 _moduleTNC.cp310-win_amd64.pyd
7FFFCFF40000 _cobyla.cp310-win_amd64.pyd
7FFFCFF10000 _slsqp.cp310-win_amd64.pyd
7FFFCFEE0000 _minpack.cp310-win_amd64.pyd
7FFFCFEA0000 givens_elimination.cp310-win_amd64.pyd
7FF8066D0000 _zeros.cp310-win_amd64.pyd
7FFFCFE30000 __nnls.cp310-win_amd64.pyd
7FFFCF9C0000 _highs_wrapper.cp310-win_amd64.pyd
7FFFCF8D0000 _highs_constants.cp310-win_amd64.pyd
7FFFCF800000 _interpolative.cp310-win_amd64.pyd
7FFFCF7B0000 _bglu_dense.cp310-win_amd64.pyd
7FFFCF770000 _lsap.cp310-win_amd64.pyd
7FFF9A100000 _ckdtree.cp310-win_amd64.pyd
7FFFCF660000 _qhull.cp310-win_amd64.pyd
7FFFCF620000 _voronoi.cp310-win_amd64.pyd
7FFF9A0D0000 _distance_wrap.cp310-win_amd64.pyd
7FFF9A090000 _hausdorff.cp310-win_amd64.pyd
7FFF99EA0000 _ufuncs.cp310-win_amd64.pyd
7FFF99D40000 _ufuncs_cxx.cp310-win_amd64.pyd
7FFF99CB0000 _specfun.cp310-win_amd64.pyd
7FFFCF600000 _comb.cp310-win_amd64.pyd
7FFF99C90000 _ellip_harm_2.cp310-win_amd64.pyd
7FFF99B30000 _distance_pybind.cp310-win_amd64.pyd
7FFF99A80000 _rotation.cp310-win_amd64.pyd
7FFF99A60000 _direct.cp310-win_amd64.pyd
7FF8061A0000 _imagingft.cp310-win_amd64.pyd
7FFF994C0000 _C.pyd
7FFF99490000 image.pyd
7FFF990D0000 nvjpeg64_11.dll
7FFF99030000 _safetensors_rust.cp310-win_amd64.pyd
7FFF98FF0000 _yaml.cp310-win_amd64.pyd
00005F310000 _message.pyd
7FFF98D30000 onnx_cpp2py_export.cp310-win_amd64.pyd
7FFF97DC0000 onnxruntime_pybind11_state.pyd
7FF800000000 onnxruntime_providers_shared.dll
7FFF97DA0000 _mio_utils.cp310-win_amd64.pyd
7FFF97D60000 _mio5_utils.cp310-win_amd64.pyd
7FFF97D40000 _streams.cp310-win_amd64.pyd
7FFF97D20000 _errors.cp310-win_amd64.pyd
7FFF979C0000 hdf5.dll
7FFF979A0000 h5.cp310-win_amd64.pyd
7FFF97960000 defs.cp310-win_amd64.pyd
7FFF97930000 hdf5_hl.dll
7FFF97900000 _objects.cp310-win_amd64.pyd
7FFF978C0000 _conv.cp310-win_amd64.pyd
7FFF978A0000 h5r.cp310-win_amd64.pyd
7FFF97830000 h5p.cp310-win_amd64.pyd
7FFF977D0000 h5t.cp310-win_amd64.pyd
7FFF977B0000 utils.cp310-win_amd64.pyd
7FFF97780000 h5s.cp310-win_amd64.pyd
7FFF97760000 h5ac.cp310-win_amd64.pyd
7FFFD8C30000 _proxy.cp310-win_amd64.pyd
7FFF97740000 h5z.cp310-win_amd64.pyd
7FFF97640000 h5a.cp310-win_amd64.pyd
7FFF975F0000 h5d.cp310-win_amd64.pyd
7FFF97720000 h5ds.cp310-win_amd64.pyd
7FFF97570000 h5f.cp310-win_amd64.pyd
7FFF97540000 h5g.cp310-win_amd64.pyd
7FFF975D0000 h5i.cp310-win_amd64.pyd
7FFF97510000 h5fd.cp310-win_amd64.pyd
7FFF97500000 h5pl.cp310-win_amd64.pyd
7FFF97410000 h5o.cp310-win_amd64.pyd
7FFF973F0000 h5l.cp310-win_amd64.pyd
7FFF973C0000 _selector.cp310-win_amd64.pyd
7FFF97120000 _pyopenvino.cp310-win_amd64.pyd
7FFED3F00000 openvino.dll
000180000000 tbb.dll
7FFF970E0000 _pyclipper.cp310-win_amd64.pyd
7FFED3EA0000 geos_c-84d02d5b10aa37e3ab60a885dc5b531b.dll
7FFED3CC0000 geos-2c37bebf00da028367beef6fb37256e0.dll
7FFED3CA0000 _speedups.cp310-win_amd64.pyd
7FFF974F0000 _feature_detector_cpp.cp310-win_amd64.pyd
7FFED3B00000 metrics_cpp_avx2.cp310-win_amd64.pyd
7FFED3AB0000 _initialize_cpp.cp310-win_amd64.pyd
7FFED39C0000 fuzz_cpp_avx2.cp310-win_amd64.pyd
7FFED3920000 process_cpp_impl.cp310-win_amd64.pyd
7FFED38F0000 utils_cpp.cp310-win_amd64.pyd
7FFED38D0000 _vq.cp310-win_amd64.pyd
7FFED3870000 _hierarchy.cp310-win_amd64.pyd
7FFED3810000 _optimal_leaf_ordering.cp310-win_amd64.pyd
7FFED37D0000 _backend_agg.cp310-win_amd64.pyd
7FFED35F0000 _sentencepiece.cp310-win_amd64.pyd
7FFED3020000 tokenizers.cp310-win_amd64.pyd
7FF80C2D0000 nvcuda64.dll
7FF84A360000 msasn1.dll
7FF8401D0000 cryptnet.dll
7FF847520000 drvstore.dll
7FF84A5A0000 devobj.dll
7FF84A1D0000 wldp.dll
7FF833480000 nvapi64.dll
7FF84C6F0000 SETUPAPI.dll
7FFED2FE0000 orjson.cp310-win_amd64.pyd
7FFED27D0000 cygrpc.cp310-win_amd64.pyd
7FFED20E0000 _rust.pyd
7FFED2080000 _bcrypt.pyd
7FFED2040000 _nd_image.cp310-win_amd64.pyd
7FFED1FE0000 _ni_label.cp310-win_amd64.pyd
7FFED1F70000 _odepack.cp310-win_amd64.pyd
7FFED1EF0000 _quadpack.cp310-win_amd64.pyd
7FFED1E60000 _vode.cp310-win_amd64.pyd
7FFED1DE0000 _dop.cp310-win_amd64.pyd
7FFED1D60000 _lsoda.cp310-win_amd64.pyd
7FFED1CB0000 _stats.cp310-win_amd64.pyd
7FFED1A20000 cython_special.cp310-win_amd64.pyd
7FFED1910000 beta_ufunc.cp310-win_amd64.pyd
7FFED1800000 binom_ufunc.cp310-win_amd64.pyd
7FFED16F0000 nbinom_ufunc.cp310-win_amd64.pyd
7FFED15F0000 hypergeom_ufunc.cp310-win_amd64.pyd
7FFED14E0000 ncf_ufunc.cp310-win_amd64.pyd
7FFED13D0000 ncx2_ufunc.cp310-win_amd64.pyd
7FFED12C0000 nct_ufunc.cp310-win_amd64.pyd
7FFED1270000 skewnorm_ufunc.cp310-win_amd64.pyd
7FFED1160000 invgauss_ufunc.cp310-win_amd64.pyd
7FFED10E0000 _fitpack.cp310-win_amd64.pyd
7FFED1030000 dfitpack.cp310-win_amd64.pyd
7FFED0FD0000 _bspl.cp310-win_amd64.pyd
7FFED0F70000 _ppoly.cp310-win_amd64.pyd
7FFED0F10000 interpnd.cp310-win_amd64.pyd
7FFED0DE0000 _rbfinterp_pythran.cp310-win_amd64.pyd
7FFED0D90000 _rgi_cython.cp310-win_amd64.pyd
7FFED0D20000 _biasedurn.cp310-win_amd64.pyd
7FFED0D00000 levyst.cp310-win_amd64.pyd
7FFED0BF0000 _stats_pythran.cp310-win_amd64.pyd
7FFED0BB0000 _uarray.cp310-win_amd64.pyd
7FFED0AA0000 pypocketfft.cp310-win_amd64.pyd
7FFED0A80000 _statlib.cp310-win_amd64.pyd
7FFED0A20000 _sobol.cp310-win_amd64.pyd
7FFED09B0000 _qmc_cy.cp310-win_amd64.pyd
7FFED0890000 _mvn.cp310-win_amd64.pyd
7FFED0840000 rcont.cp310-win_amd64.pyd
7FFED0830000 _multidict.cp310-win_amd64.pyd
7FFED0810000 _quoting_c.cp310-win_amd64.pyd
7FFED07F0000 _helpers.cp310-win_amd64.pyd
7FFED07D0000 _http_writer.cp310-win_amd64.pyd
7FFED0780000 _http_parser.cp310-win_amd64.pyd
7FFED0770000 _websocket.cp310-win_amd64.pyd
7FFED0750000 _frozenlist.cp310-win_amd64.pyd
7FFED0720000 collections.cp310-win_amd64.pyd
7FFED0700000 immutabledict.cp310-win_amd64.pyd
7FFED06E0000 processors.cp310-win_amd64.pyd
7FFED06C0000 resultproxy.cp310-win_amd64.pyd
7FFED06A0000 util.cp310-win_amd64.pyd
7FFED0660000 _greenlet.cp310-win_amd64.pyd
7FFED0650000 _imagingmath.cp310-win_amd64.pyd
7FFED0640000 _webp.cp310-win_amd64.pyd
7FFED0630000 libwebpmux.dll
7FFED0620000 libwebpdemux.dll
7FFED05B0000 libwebp.dll
7FFED05A0000 libsharpyuv.dll
7FFED0580000 _tkinter.pyd
7FFED0400000 tk86t.dll
7FFED0230000 tcl86t.dll
7FF84B470000 COMDLG32.dll
7FF826D80000 COMCTL32.dll
7FF83C850000 NETAPI32.dll
7FFED0200000 zlib1.dll
7FF83DF50000 LOGONCLI.DLL
7FF849D20000 NETUTILS.DLL
7FF8476B0000 SAMCLI.DLL
7FFED0150000 _regex.cp310-win_amd64.pyd
7FFED0140000 _check_build.cp310-win_amd64.pyd
7FFED0100000 vcomp140.dll
7FFED0070000 msvcp140.dll
7FFED0030000 _isfinite.cp310-win_amd64.pyd
7FFED0000000 murmurhash.cp310-win_amd64.pyd
7FFECFFF0000 _openmp_helpers.cp310-win_amd64.pyd
7FFECFF50000 sparsefuncs_fast.cp310-win_amd64.pyd
7FFECFEF0000 _csr_polynomial_expansion.cp310-win_amd64.pyd
7FFECFE80000 _target_encoder_fast.cp310-win_amd64.pyd
7FFECFE60000 _hashing_fast.cp310-win_amd64.pyd
7FFECFE40000 _vector_sentinel.cp310-win_amd64.pyd
7FFECFDE0000 _pycrfsuite.cp310-win_amd64.pyd
7FFECFDA0000 _seq_dataset.cp310-win_amd64.pyd
7FFECFD50000 _random.cp310-win_amd64.pyd
7FFECFD20000 _expected_mutual_info_fast.cp310-win_amd64.pyd
7FFECFC90000 _dist_metrics.cp310-win_amd64.pyd
7FFECFC50000 _argkmin.cp310-win_amd64.pyd
7FFECFC10000 _base.cp310-win_amd64.pyd
7FFECFBB0000 _datasets_pair.cp310-win_amd64.pyd
7FFECFB50000 _cython_blas.cp310-win_amd64.pyd
7FFECFAF0000 _middle_term_computer.cp310-win_amd64.pyd
7FFECFAE0000 _heap.cp310-win_amd64.pyd
7FFECFAD0000 _sorting.cp310-win_amd64.pyd
7FFECFA90000 _argkmin_classmode.cp310-win_amd64.pyd
7FFECFA40000 _radius_neighbors.cp310-win_amd64.pyd
7FFECFA00000 _radius_neighbors_classmode.cp310-win_amd64.pyd
7FFECF9C0000 _pairwise_fast.cp310-win_amd64.pyd
7FFECF960000 _cd_fast.cp310-win_amd64.pyd
7FFECF780000 _loss.cp310-win_amd64.pyd
7FFECF740000 arrayfuncs.cp310-win_amd64.pyd
7FFECF700000 _liblinear.cp310-win_amd64.pyd
7FFECF6A0000 _libsvm.cp310-win_amd64.pyd
7FFECF640000 _libsvm_sparse.cp310-win_amd64.pyd
7FFECF600000 _sag_fast.cp310-win_amd64.pyd
7FFECF5B0000 _sgd_fast.cp310-win_amd64.pyd
7FFECF580000 _weight_vector.cp310-win_amd64.pyd
7FFECF510000 _svmlight_format_fast.cp310-win_amd64.pyd
7FFECF500000 speedups.cp310-win_amd64.pyd
7FFECF4E0000 ujson.cp310-win_amd64.pyd
7FF8454A0000 rasadhlp.dll
7FFECF4D0000 _speedups.cp310-win_amd64.pyd
7FF843660000 fwpuclnt.dll
7FFECF4C0000 _cbson.cp310-win_amd64.pyd
7FFECF4A0000 _cmessage.cp310-win_amd64.pyd
7FFECF400000 _rust_notify.cp310-win_amd64.pyd
7FFECF3E0000 parser.cp310-win_amd64.pyd
7FFECF3D0000 url_parser.cp310-win_amd64.pyd
7FFECF140000 _extra.cp310-win_amd64.pyd
7FFECD160000 mupdfcpp64.dll
7FFECC740000 _mupdf.pyd
7FFECF130000 _wrappers.cp310-win_amd64.pyd
7FFECF0D0000 hnswlib.cp310-win_amd64.pyd
7FFECC200000 pdfium.dll
7FF826AC0000 GDIPLUS.DLL
7FF84CB80000 MSCTF.dll
7FFECF350000 _pillow_heif.cp310-win_amd64.pyd
7FFECF190000 libheif-50ec905e77f9da70dc4650e831a2ddfc.dll
7FFECF330000 libwinpthread-1-60c9caf0f4ff0fee4fcd00b1b6bef7aa.dll
7FFECB6B0000 libaom-dbb8f4de1c733a287d11cd64cd8462db.dll
7FFECF300000 libgcc_s_seh-1-9b6b724824997f52ee36af4f72787aee.dll
7FFECBFB0000 libstdc++-6-58186925398578d557aa2556ccbf6d2e.dll
7FFECE840000 libde265-0-d2ff8eb04521754b4e12762167ebdaf9.dll
7FFECA350000 libx265-c6b040649b9621ebb6c4276513643392.dll
022402330000 msys-magic-1.dll
000210040000 msys-2.0.dll
022402300000 msys-z.dll
022402360000 msys-bz2-1.dll
022403920000 msys-lzma-5.dll
02254DAC0000 msys-zstd-1.dll
Windows fatal exception: access violation

pseudotensor · 2024-05-19T17:57:05Z

I guess DocTR has issues with windows VM.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

doctr for scanned pdf #1614

doctr for scanned pdf #1614

InesBenAmor99 commented May 13, 2024

pseudotensor commented May 14, 2024 •

edited

InesBenAmor99 commented May 14, 2024

pseudotensor commented May 14, 2024

pseudotensor commented May 14, 2024

InesBenAmor99 commented May 17, 2024

pseudotensor commented May 19, 2024

doctr for scanned pdf #1614

doctr for scanned pdf #1614

Comments

InesBenAmor99 commented May 13, 2024

pseudotensor commented May 14, 2024 • edited

InesBenAmor99 commented May 14, 2024

pseudotensor commented May 14, 2024

pseudotensor commented May 14, 2024

InesBenAmor99 commented May 17, 2024

pseudotensor commented May 19, 2024

pseudotensor commented May 14, 2024 •

edited