Skip to content

Latest commit

 

History

History
21 lines (13 loc) · 991 Bytes

README.md

File metadata and controls

21 lines (13 loc) · 991 Bytes

OCR-Text-To-Speech-Application

Resimler üzerindeki text’i okuyan ve bunu seslendiren bir uygulamanın günlük hayata pek çok alanda uygulaması olabilir. Örneğin, okuma yazma bilmeyenler için kitap veya web sayfası resimleri gibi metinsel içerik barındıran görüntülerin okunması ve seslendirilmesi, görme engelliler için metinlerin okunması vb.

Bu proje, görüntü (fotoğraf, resim gibi) üzerinde bulunan metinsel içeriği okuyan ve text’e dönüştüren ve bu text içeriği seslendirerek görüntüdeki metinsel içeriğin seslendirilmesini sağlayan bir Python uygulamasıdır.

Uygulama Google'ın seslendirme desteği verdiği tüm dilleri içermektedir.

Uygulamanın çalışması için önce " https://github.com/UB-Mannheim/tesseract/wiki " linkinden Tesseract indirilip kurulmalıdır.

Örnek görseller "img" dosyasının içinde bulunmaktadır.

Uygulama

Pic