Adobe OCR không nhận dạng văn bản [Fix]

Nếu bạn là một chuyên gia CNTT, bạn sẽ biết rằng OCR là viết tắt của nhận dạng ký tự quang học. Và bạn cũng biết rằng Adobe OCR không nhận dạng văn bản. Nhưng những gì bạn có thể không biết là làm thế nào để khắc phục vấn đề này. Có một vài điều bạn có thể thử để Adobe OCR nhận dạng văn bản. Điều đầu tiên bạn có thể thử là cập nhật phần mềm Adobe Acrobat của mình. Đôi khi, chỉ cần cập nhật phần mềm của bạn có thể khắc phục sự cố. Nếu cập nhật phần mềm của bạn không hoạt động, điều tiếp theo bạn có thể thử là thay đổi ngôn ngữ nhận dạng. Để thực hiện việc này, hãy mở Adobe Acrobat, nhấp vào 'Chỉnh sửa' và sau đó nhấp vào 'Tùy chọn'. Từ đó, nhấp vào 'Ngôn ngữ' và sau đó nhấp vào 'Nhận dạng'. Cuối cùng, chọn ngôn ngữ bạn muốn sử dụng để nhận dạng. Nếu thay đổi ngôn ngữ nhận dạng không hoạt động, điều tiếp theo bạn có thể thử là thay đổi cài đặt OCR. Để thực hiện việc này, hãy mở Adobe Acrobat, nhấp vào 'Chỉnh sửa' và sau đó nhấp vào 'Tùy chọn'. Từ đó, nhấp vào 'OCR' và sau đó nhấp vào 'Cài đặt'. Cuối cùng, thay đổi cài đặt để xem điều đó có khắc phục được sự cố không. Nếu bạn đã thử tất cả những cách này mà Adobe OCR vẫn không nhận dạng được văn bản, thì vấn đề có thể là do tệp PDF của bạn. Nếu đúng như vậy, bạn sẽ cần liên hệ với bộ phận hỗ trợ khách hàng của Adobe để được trợ giúp.

Nhận dạng ký tự quang học (OCR) có thể tốt hơn bánh mì cắt lát cho những người cần chuyển đổi các trang văn bản thành văn bản có thể chỉnh sửa. có thể bạn có các trang văn bản mà bạn đang quét vào máy tính của mình hiện cần được chuyển đổi thành dạng có thể chỉnh sửa. Có thể không có đủ thời gian để gõ, hoặc đơn giản là có quá nhiều thời gian để gõ. Chà, nhận dạng ký tự quang học có thể giúp ích cho việc đó. Bạn có thể quét các trang vào máy tính của mình và mở chúng bằng Adobe Acrobat và cố gắng sử dụng chức năng OCR để nhận dạng văn bản và cung cấp cho bạn phiên bản có thể chỉnh sửa. Ngay khi bạn chuẩn bị thực hiện điệu nhảy chiến thắng, bạn nhận được thông báo lỗi Acrobat không thể thực hiện OCR trên trang này vì trang này chứa văn bản hiển thị.

Adobe OCR không nhận dạng văn bản

Acrobat Professional có khả năng OCR cho phép bạn lưu các tài liệu được quét dưới dạng RTF hoặc dưới dạng tài liệu Microsoft Word, cả Doc và Docx. Có thể đôi khi bạn mở một tài liệu trong Adobe Acrobat Professional và thấy một số văn bản, nhưng Acrobat lại báo lỗi. Acrobat không thể sử dụng OCR. Điều này có thể là do một số lý do.

Văn bản được hiển thị/có thể chỉnh sửa
Nguồn bị méo hoặc mờ
bản gốc kém
Đồ họa và hình thức

Acrobat không thể thực hiện OCR trên trang này vì trang này chứa văn bản hiển thị.

1] Văn bản được hiển thị/có thể chỉnh sửa

Văn bản có thể phát là văn bản có thể chỉnh sửa tồn tại trong tệp mà bạn muốn thực hiện nhận dạng ký tự. Acrobat không thể thực hiện OCR trên tài liệu có chứa văn bản hiển thị. Đây là nguyên nhân ít rõ ràng nhất gây ra lỗi quét OCR vì chúng tôi luôn cho rằng văn bản đang được đọc cũng phải được quét bằng OCR.

Trả lời:

Có hai cách để xử lý lỗi nếu đó là sự cố.

Cố gắng lấy một bản sao của tài liệu không có văn bản hiển thị.
Chuyển đổi PDF sang TIFF, sau đó quay lại PDF và thử OCR lần nữa.

Để chuyển đổi PDF thành TIFF, hãy mở nó trong Acrobat và chọn Tệp, sau đó Lưu dưới dạng. Khi hộp thoại Save As xuất hiện, chọn TIFF (*.tif, *.tiff) từ danh sách Loại tệp. Chỉ định vị trí bạn muốn lưu tệp, sau đó nhấp vào Lưu. Acrobat lưu từng trang của tài liệu PDF dưới dạng tệp TIFF được đánh số thứ tự riêng biệt. Sau đó, bạn mở từng tệp TIFF và sử dụng Acrobat để nhận dạng chúng.

Nếu bạn muốn hợp nhất các tài liệu thành một, hãy làm như sau:

Mở Acrobat, chọn Tài liệu sau đó Tạo PDF sau đó Từ nhiều tệp .
Chọn duyệt để chọn và thêm từng tệp PDF. Sắp xếp các tệp theo cách bạn muốn chúng xuất hiện trong PDF mới.
Chọn KHỎE .

2] Nguồn bị méo hoặc mờ

tài liệu mờ

Một lý do khác khiến Acrobat không thể thực hiện OCR trên tài liệu là vì tài liệu đó có độ phân giải thấp. Các tài liệu có độ phân giải thấp có thể bị mờ và Acrobat không thể thực hiện nhận dạng ký tự trên chúng.

sbx pro studio cài đặt tốt nhất

Trả lời:

Lấy nguồn tài liệu độ phân giải cao. Nếu bạn đang quét tài liệu giấy, hãy điều chỉnh độ phân giải của máy quét để quét ở độ phân giải cao hơn.

tài liệu bị bóp méo

Acrobat có thể không nhận dạng được văn bản trong tài liệu không được căn chỉnh chính xác. Tài liệu có thể không được quét chính xác nên Acrobat không thể thực hiện nhận dạng ký tự trên đó.

Trả lời:

Trước khi bạn bắt đầu quét, đảm bảo giấy bạn đang quét phẳng. Bạn cũng có thể mở một tài liệu bị bóp méo trong Photoshop và làm thẳng nó. Đây là một bài đăng sẽ chỉ cho bạn cách sử dụng công cụ làm thẳng trong Photoshop. Công cụ này có thể giúp bạn chỉnh sửa tài liệu được quét trước khi thực hiện OCR trong Acrobat.

3] Bản gốc kém chất lượng

Nếu tài liệu nguồn có chất lượng kém, chẳng hạn như fax, Acrobat có thể không nhận dạng đúng tài liệu đó. Sau đó, bạn sẽ phải hướng tới chất lượng tốt hơn hoặc mạo hiểm sửa lỗi đầu ra.

Trả lời:

lỗi cài đặt skype 1603

Nhận nguồn chất lượng tốt nhất cho OCR. Nếu tài liệu chất lượng thấp là tất cả những gì bạn có, bạn có thể phải chạy OCR và hy vọng ít nhất một số tài liệu được nhận dạng rồi điền vào những phần còn thiếu.

4] Đồ họa và hình dạng

Các tài liệu kết hợp đồ họa và hình dạng sẽ không được OCRed trong Acrobat. Tài liệu được sử dụng cho OCR với Acrobat không được chứa đồ họa hoặc dạng hỗn hợp, nếu không, điều này có thể dẫn đến lỗi hoặc đầu ra có thể không chính xác.

Trả lời:

Tìm phiên bản văn bản của tài liệu để thực hiện OCR. Bạn cũng có thể cần thực hiện nhận dạng tài liệu bằng đồ họa và hình dạng, nếu cách đó hiệu quả, bạn có thể cần chỉnh sửa đầu ra.

OCR trong Adobe Acrobat là gì?

OCR là quá trình Acrobat xác thực văn bản hoặc hình ảnh pixel. Mỗi ký tự được nhận dạng và chuyển đổi thành văn bản. Acrobat so sánh hình dạng và độ đậm nét của hình ảnh với các phông chữ đã được cài đặt trên PC của bạn trong quá trình OCR. Sau đây là các nguyên nhân gây ra lỗi quét OCR.

Định dạng tệp nào không phù hợp với OCR?

Định dạng tệp JPEG không phải là định dạng tốt nhất để lưu cho OCR vì JPEG có xu hướng giảm chất lượng mỗi khi được lưu. Ngay cả khi bạn đang chuyển đổi JPEG sang PDF, nó vẫn có thể có chất lượng kém. Tốt nhất là lưu tài liệu của bạn dưới dạng PDF hoặc TIFF nếu bạn định thực hiện nhận dạng ký tự trên chúng.