192 Кб, 521x343
Програмач, подскажи. Гугл и ChatGPT не помогли.
Нужно распознавать много картинок с текстом, который может быть на русском, английском или смеси русского и английского. Есть ли решения, которые эффективно понимают что текст на русском или английском и не смешивают два языка, но при этом понимают что слово в русском тексте на английском?
Нужно распознавать много картинок с текстом, который может быть на русском, английском или смеси русского и английского. Есть ли решения, которые эффективно понимают что текст на русском или английском и не смешивают два языка, но при этом понимают что слово в русском тексте на английском?
>>31945 (OP)
Claude 3.5 sonnet
https://familylocket.com/handwritten-text-recognition-by-claude-3-5-sonnet/
>Есть ли решения, которые эффективно понимают что текст на русском или английском и не смешивают два языка
Claude 3.5 sonnet
https://familylocket.com/handwritten-text-recognition-by-claude-3-5-sonnet/
>>32026
Мда пиздец ты фрукт конечно. Тогда только на https://huggingface.co/ искать, оттуда качать и локально ставить. Иначе только OCR-библиотеки на гитхабе.
Мда пиздец ты фрукт конечно. Тогда только на https://huggingface.co/ искать, оттуда качать и локально ставить. Иначе только OCR-библиотеки на гитхабе.
>>32039
Мне нужно распознавальщик типа Tesseract, но чтобы понимал как распозанвать текст на двух языках.
На huggingface я не знаю что искать, где, как это устанавливать...
Мне нужно распознавальщик типа Tesseract, но чтобы понимал как распозанвать текст на двух языках.
На huggingface я не знаю что искать, где, как это устанавливать...
>>32053
Бля там есть категория мультимодальных моделей, называется "image-text-to-text" https://huggingface.co/models?pipeline_tag=image-text-to-text&sort=trending и там в описании всё написано, они могут таблицы понимать, математические формулы, графики. Там надо искать подробнее. Мне-то это зачем? Мне это нахуй не надо. Я просто дал направление для дальнейшего поиска
Бля там есть категория мультимодальных моделей, называется "image-text-to-text" https://huggingface.co/models?pipeline_tag=image-text-to-text&sort=trending и там в описании всё написано, они могут таблицы понимать, математические формулы, графики. Там надо искать подробнее. Мне-то это зачем? Мне это нахуй не надо. Я просто дал направление для дальнейшего поиска
>>32063
у меня программа на JS, я испольую tesseract.js
как всё это с huggingface использовать в JavaScript коде? я не понимат
у меня программа на JS, я испольую tesseract.js
как всё это с huggingface использовать в JavaScript коде? я не понимат
EasyOCR может распознавать нормально мультиязычно только непонятно нужно ли ему нейромодель
>>31945 (OP)
Да, есть решения, которые распознают текст на русском, английском и смешанных языках. Они используют модели машинного обучения, которые обучены на больших наборах данных. Эти решения могут эффективно распознавать языки и не смешивать их, а также понимать слова на английском в русском тексте.
Да, есть решения, которые распознают текст на русском, английском и смешанных языках. Они используют модели машинного обучения, которые обучены на больших наборах данных. Эти решения могут эффективно распознавать языки и не смешивать их, а также понимать слова на английском в русском тексте.
>>63508
Капчу тоже ИИ разгадывал? )
Капчу тоже ИИ разгадывал? )
>>32089
Пошёл нахуй
Пошёл нахуй