The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Библиотека для распознавания русской речи на Android и Linux..."
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Библиотека для распознавания русской речи на Android и Linux..."  +1 +/
Сообщение от opennews (??), 11-Янв-20, 19:27 
Опубликована версия 0.3 библиотеки vosk для локального распознавания слитной речи, поддерживающая русский язык. Для платформы Android подготовлен...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=52171

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

1. Сообщение от Аноним (-), 11-Янв-20, 19:27   +6 +/
Русский мат он распознает?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #32

2. Сообщение от Аноним (2), 11-Янв-20, 19:30   –1 +/
На сони zx1 не ставится (
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #3, #74, #84

3. Сообщение от nshmyrev (ok), 11-Янв-20, 19:31   +1 +/
Что пишет? Не ставится через скачивание или через adb?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2 Ответы: #35

4. Сообщение от nshmyrev (ok), 11-Янв-20, 19:33   +1 +/
@модератор. Видео тут не совсем в тему, к сожалению.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #6

5. Сообщение от Аноним (5), 11-Янв-20, 19:35   +2 +/
Нормально, нужно. Для китайского и японского сделайте плиз, а то у меня небольшие проблемы с переводом устной речи в письменную (звучит одинаково, а пишется по-разному). Онлайн распознавание плохо справляется.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #7

6. Сообщение от Аноним (6), 11-Янв-20, 19:38   +/
Почему? Там же про концепцию vosk во второй половине доклада?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4 Ответы: #9

7. Сообщение от nshmyrev (ok), 11-Янв-20, 19:40   +2 +/
Китайский есть, моделька на гитхабе. Не знаю, насколько надёжно будет работать. Скорее всего, хуже чем по сети. Но может пригодиться.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5 Ответы: #14

8. Сообщение от user90 (?), 11-Янв-20, 19:41   –11 +/
И практическая польза этого ..? Ну если откинуть киберпанк и "тупые колонки"? ;)
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #11, #12, #13, #31, #143

9. Сообщение от nshmyrev (ok), 11-Янв-20, 19:41   +/
Это видео про серверное приложение для тренировки, а не про библиотеку для андроида.

Библиотека работает на kaldi доработанном.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6

10. Сообщение от Nekrasov33 (ok), 11-Янв-20, 19:47   +1 +/
> Опубликована версия 0.3 библиотеки vosk для локального распознавания слитной речи, поддерживающая
> русский язык. Для платформы Android подготовлен...

чем дальше, тем ближе Алиса Селезнева )


Ответить | Правка | Наверх | Cообщить модератору
Ответы: #15

11. Сообщение от AlexYeCu_not_logged (?), 11-Янв-20, 19:47   +5 +/
>И практическая польза этого ..? Ну если откинуть киберпанк и "тупые колонки"? ;)

Управление различными устройствами, когда руки заняты: ответить на звонок, отклонить звонок, позвонить и т.д.
Аналогично, но для людей с ограниченной подвижностью
Компьютерные игры.
Обучающие упражнения для некоторых профессий.

Пока проблем две: низкое качество распознавания и (там где оно повыше) привязка к не всегда доступным серверам.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8 Ответы: #16

12. Сообщение от Аноним ещё один (?), 11-Янв-20, 19:49   +5 +/
Пользы никакой. Можешь бухать дальше.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8

13. Сообщение от Sluggard (ok), 11-Янв-20, 19:49   +7 +/
Инвалидам может помочь голосовой набор. Стенограммы.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8

14. Сообщение от Аноним (5), 11-Янв-20, 19:50   +5 +/
Японский был бы интересней, почему-то про него все забывают. Китайский я почти не понимаю, японский разговорный и письменный в некоторой мере вполне. Но сложности с тем, как записать, я думаю будут те же (т.е. нужна эвристика и словари с угадыванием и выбором из нескольких вариантов).
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #7 Ответы: #62, #80

15. Сообщение от Аноним (15), 11-Янв-20, 20:01   +1 +/
set Apocalypse {Алиса Селезнёва}
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #10

16. Сообщение от user90 (?), 11-Янв-20, 20:02   –18 +/
> когда руки заняты

Хорошо, что не рот, ХА-ХА-ХА.

Вот про инвалидов чот не подумал, да.. ну а для игр можно применить вообще_любую технологию))

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #11 Ответы: #22, #67

17. Сообщение от Аноним (17), 11-Янв-20, 20:33   –17 +/
У меня есть сири.красиво и просто работает
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #19, #26

18. Сообщение от Константавр (ok), 11-Янв-20, 20:33   +3 +/
Успехов проекту. Рад, что кто-то занимается этим. Я какое-то время назад пытался толкать паровоз, тренировать сфинкса, но единственное приложение, которое позволяло голосом управлять десктопом (Simon) бросили, с тех пор в этой сфере прям дыра была. Особенно в русской среде.

Рад за разработчиков, но немного не понимаю, а какие приложения подхватят ваш движок? опять всё будет только для Андроида и будет использоваться только шпионящими программами? А полезное? Чтобы голосом сказать "закрой окно", "открой фаерфокс" и пр?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #20, #21

19. Сообщение от Аноним (19), 11-Янв-20, 20:49   +9 +/
И тоже без привязки к серверам?
Здесь фишка именно в том, чтобы командовать железками, не ставя об этом в известность Гугл или Эппл.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #17 Ответы: #41

20. Сообщение от nshmyrev (ok), 11-Янв-20, 20:49   +5 +/
Сейчас много появляется полезных приложений для RPi и мобильных. Rhasspy набирает популярность, например, и куча других умных домов.

В Kodi можно встроить эту распознавалку, управлять голосом, пока руки не дошли, но скоро будет.

Эта библиотека распознаёт гораздо лучше, чем pocketsphinx, тренировать её не нужно.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #18 Ответы: #23

21. Сообщение от vosk (?), 11-Янв-20, 20:54   +3 +/
> "закрой окно"

Упс... Хозяин, похоже, я оконной рамой кота перерубила...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #18 Ответы: #27

22. Сообщение от AlexYeCu_not_logged (?), 11-Янв-20, 21:03   +17 +/
>Хорошо, что не рот, ХА-ХА-ХА.

Если запишешь, как ты ртом управляешь автомобилем, прокладываешь слаботочку под потолком, сортируешь кроликов, пересаживаешь цветы, месишь тесто или убираешь снег — выкладывай на ютуб и кидай ссылку сюда.

Если же твой основной род занятий,  дела по дому или хобби предполагают всё время занятый рот — выкладывать ничего не надо. Хотя оно, наверное, к лучшему, что рот-то у тебя по большей части занят.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16

23. Сообщение от Константавр (ok), 11-Янв-20, 21:05   +4 +/
>Эта библиотека распознаёт гораздо лучше, чем pocketsphinx, тренировать её не нужно.

Верю. Но меня интересует именно десктоп. Есть полупарализованный знакомый, которому важно иметь нормальное голосовое управление компом. И он не один такой. Линукс когда-то предлагал что-то, что можно (при старании и понимании вопроса) применить, но всё что я знаю находится в стагнации. И распознавалки, и читалки и, тем более, управлялки.

А русскоязычные проекты тем более, вот в Альте, например, было несколько движков чтения (не знаю как сейчас), но как заставить десктопное приложение читать этим движком? они же умеют или espeak, или festival и больше ничего. И толку мне с хороших русскоязычных движков, которыми ни одно приложение не умеет пользоваться?

То же и с этой библиотекой распознавания, ну написали, пара энтузиастов прикрутит это к управлению умным домом, а остальные тупо на андроиде за пользователем будут следить :) А бедным инвалидам так и останется - винда и стандартные движки, которые тоже все теперь любют через сеть работать.

Но я нудю. Наверное.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #20 Ответы: #28, #30, #44

24. Сообщение от Аноним (26), 11-Янв-20, 21:13   +/
А есть такое же, но со вкусом эсперанто?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #76

25. Сообщение от Аноним (25), 11-Янв-20, 21:18   +1 +/
А чем https://github.com/alphacep/vosk от https://pypi.org/project/vosk/ отличается? На первый взгляд разные библиотеки.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #29

26. Сообщение от Аноним (26), 11-Янв-20, 21:19   +9 +/
Кто чей в этой связке это ещё бабушка надвое сказала.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #17 Ответы: #110

27. Сообщение от Дегенератор (ok), 11-Янв-20, 21:21   +3 +/
У меня один раз студент, которому я в конце занятий сказал закрыть все открытые окна, с каменным лицом полез на подоконник. Я даже сразу и не понял в чем дело.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #21

28. Сообщение от Аноним (28), 11-Янв-20, 21:27   +1 +/
Сделай сам, вон там пример на питоне есть. Для начала можно все свести к карте соответствий «фраза - шелл-команда»
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #23

29. Сообщение от nshmyrev (ok), 11-Янв-20, 21:32   +2 +/
> А чем https://github.com/alphacep/vosk от https://pypi.org/project/vosk/ отличается?
> На первый взгляд разные библиотеки.

https://github.com/alphacep/vosk - для тренировки
https://github.com/alphacep/vosk-api - сборка для pypi (загружается на https://pypi.org/project/vosk/)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #25

30. Сообщение от nshmyrev (ok), 11-Янв-20, 21:38   +4 +/
> А русскоязычные проекты тем более, вот в Альте, например, было несколько движков
> чтения (не знаю как сейчас), но как заставить десктопное приложение читать
> этим движком? они же умеют или espeak, или festival и больше
> ничего. И толку мне с хороших русскоязычных движков, которыми ни одно
> приложение не умеет пользоваться?

Для чтения у нас есть

https://github.com/alphacep/tn2-wg

Пример

https://raw.githubusercontent.com/alphacep/tn2-wg/master/tes...

Правда, для быстрой работы нужна CUDA + NVIDIA карта. И с ударениями не всегда гладко, работаем над этим.


Ответить | Правка | Наверх | Cообщить модератору
Родитель: #23 Ответы: #33, #50

31. Сообщение от Ordu (ok), 11-Янв-20, 21:54   +1 +/
Можно общаться в чате не прибегая к помощи экранной клавиатуры.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8

32. Сообщение от Аноним (-), 11-Янв-20, 22:16   –10 +/
Интересно, отсылает ли эта библиотека телеметрию по частоте использования различных слов.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #77

33. Сообщение от Константавр (ok), 11-Янв-20, 22:31   +1 +/
>CUDA + NVIDIA

Это уже перебор. А результат не так уж и убедителен. Фестиваль почти так же читает. Немного больше проработки чувствуется, но целую куду на это бросать??? А что делать владельцам стааарых лаптопов с интелловской встройкой? Я понимаю, ЖД, какиенить, для оповещения о поезде, могут себе позволить такое. Народ! Спуститесь с небес, на землю, к инвалидам!

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #30 Ответы: #51, #71

34. Сообщение от corvuscor (ok), 11-Янв-20, 22:46   +/
Главный то вопрос - какая точность распознавания? Понятно, что точнее DeepSpeech, но это сколько в граммах?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #37

35. Сообщение от Аноним (35), 11-Янв-20, 22:51   –2 +/
Тыкаю в скачанный apk. Пытается поставить, потом молча пишет "не установлено". Как поставить, чтобы была видна ошибка?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #3 Ответы: #38, #47

37. Сообщение от nshmyrev (ok), 11-Янв-20, 22:51   +2 +/
> Главный то вопрос - какая точность распознавания? Понятно, что точнее DeepSpeech, но
> это сколько в граммах?

На IWSLT тесте (ted talks)

deepspeech 0.6  (1Gb)                                WER 21.10%

deepspeech tflite для андроида (50Mb)  WER 48.57%

Jasper (Nemo from Nvidia)                         WER 12.9%

Kaldi (aspire model)                                     WER 12.7 (серверная модель)

android-en-us                                              WER 14.3 (модель для андроида)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #34 Ответы: #43, #106

38. Сообщение от nshmyrev (ok), 11-Янв-20, 22:53   +/
> Тыкаю в скачанный apk. Пытается поставить, потом молча пишет "не установлено". Как
> поставить, чтобы была видна ошибка?

Такое есть?

Menu > Settings > Applications and make sure “Unknown sources” is checked

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #35 Ответы: #45, #56

39. Сообщение от Аноним (47), 11-Янв-20, 23:01   –1 +/
>alphaceph

Это в честь крайзиса что-ли?

Ответить | Правка | Наверх | Cообщить модератору

40. Сообщение от Виталий (??), 11-Янв-20, 23:15   +1 +/
С микрофона не распознает
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #42

41. Сообщение от Michael Shigorinemail (ok), 11-Янв-20, 23:16   +16 +/
Человек не догадывается, что это _он_ есть у Сири.  А у гуппла "благодаря" ему -- и окружающие :-/
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #19

42. Сообщение от nshmyrev (ok), 11-Янв-20, 23:18   +2 +/
> С микрофона не распознает

Модель телефона какая?

Ассистент какой-нибудь в фоне работает?

Желательно ещё logcat посмотреть.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #40

43. Сообщение от corvuscor (ok), 11-Янв-20, 23:18   +/
О, неплохо так. Надо бы потестить.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #37

44. Сообщение от Michael Shigorinemail (ok), 11-Янв-20, 23:20   +1 +/
TTS есть, но почти не видящий человек, который это всё направление тащил -- ушёл из компании (и из команды) после закрытия проекта deepsolver, где упёрлись в конфликт SAT-солверов и альтернатив в репозитории.

Для озвучки orca вроде была, этот класс ПО называется screenreader.

Думаю, можно всё так же пользоваться списком рассылки https://lists.altlinux.org/mailman/listinfo/homeros для таких вопросов и обсуждений.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #23 Ответы: #49

45. Сообщение от zzz (??), 11-Янв-20, 23:47   +2 +/
Если бы этой галки не стояло, то он вообще не начал бы ставиться, сперва предложив поставить галку. Очевидно, что раз приложение ставится, значит, галка стоит.

Тут, скорее, надо смотреть в сторону гапсов, поскольку аналогичное поведение я уже как-то наблюдал на старом смартфоне при попытке установить скайп - крутилась установка, потом вылетало сообщение о сбое приложения com.android.чтототам, потом еще немного - и привет "приложение не установлено".

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #38

46. Сообщение от Аноним (47), 11-Янв-20, 23:49   +/
>Языковая модель занимает всего 50Мб и работает точнее DeepSpeech (модель размером более 1Гб).
>The index is really huge, it is not expected to fit a memory of single server

Как это понимать?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #73

47. Сообщение от Аноним (47), 11-Янв-20, 23:56   –7 +/
>minSdkVersion 21

Это всё, что надо знать об авторе этого пакета.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #35 Ответы: #48, #86

48. Сообщение от nshmyrev (ok), 12-Янв-20, 00:02   +3 +/
>>minSdkVersion 21
> Это всё, что надо знать об авторе этого пакета.

А что с этим не так? Android Lolipop 5.0 выпуска 2014 года.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #47 Ответы: #54

49. Сообщение от Константавр (ok), 12-Янв-20, 00:03   +/
Не, Альтом я уже давно не пользуюсь, просто привёл пример, что у вас там было несколько пакетов читалок, от которых в самом же дистрибутиве никакой пользы, потому что ни одна программа их не использовала.

Программа  Орка - это издевательство какое-то (было, когда я последний раз этим пробовал пользоваться) оно читает всё что ненужно. А то что нужно - хрен допросисси (инвалиду она больше мешает) и не заткнуть рот ей никак. оооо... Это капец какой-то.

А вообще, именно парализованному человеку важнее управление голосом. И тут совсем туго в линуксе. и дошло одно время даже до того, что из пакетов qt и gtk начали выкидывать поддержку at-spi, мол, всё равно никому не нужна. И на этом, в принципе, я окончательно поставил крест на линуксе как среде с голосовым управлением.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #44 Ответы: #52

50. Сообщение от Аноним (47), 12-Янв-20, 00:03   +1 +/
>Правда, для быстрой работы нужна CUDA + NVIDIA карта.

Пробовали модель перевести в ONNX и завести инференс на mxnet/plaidml (оба на OpenCL)?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #30 Ответы: #53

51. Сообщение от Аноним (5), 12-Янв-20, 00:05   +/
Нвидия дешевле амд, если что. Апушки в любом случае будут давать маржинальный буст и нагреваться до температуры плавления за секуды, можно не рассматривать.

>стааарых лаптопов

Жируете, у вас лаптопы есть. Процессора в старых лаптопах тоже не хватит, например. Давайте жаловаться на процессоры в старых лаптопах.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #33 Ответы: #63

52. Сообщение от Аноним (5), 12-Янв-20, 00:12   +/
Не знаю как парализованным, но для слепых в вин10 вроде всё есть. Линукс действительно не очень френдли для инвалидов, но при большом желании можно накалякать достаточной для использования поддержки. Правда, делать это придётся более полноценным товарищам. И воркфлоу будет довольно специфический. А в весь софт пропихивать смысла действительно нет (тем более неотключаемо), как это делают сейчас.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #49 Ответы: #64

53. Сообщение от nshmyrev (ok), 12-Янв-20, 00:15   +/
>>Правда, для быстрой работы нужна CUDA + NVIDIA карта.
> Пробовали модель перевести в ONNX и завести инференс на mxnet/plaidml (оба на
> OpenCL)?

Не до этого пока, синтез как и везде пока хромает.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #50

54. Сообщение от Аноним (47), 12-Янв-20, 00:34   –29 +/
Сделав такое ограничение все с меньшими версиями де-факто были объявлены у****м*****и, недостойными юзать вашу программу. Это https://ru.wikipedia.org/wiki/Потребительство какое-то, не сказать хуже.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #48 Ответы: #55, #66

55. Сообщение от nshmyrev (ok), 12-Янв-20, 00:44   +9 +/
> Сделав такое ограничение все с меньшими версиями де-факто были объявлены у****м*****и,
> недостойными юзать вашу программу. Это https://ru.wikipedia.org/wiki/Потребительство
> какое-то, не сказать хуже.

Там у ndk проблемы с рантаймом C++ для более ранних версий, не все функции поддерживались. Более ранние версии можно поддержать, но не просто.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #54 Ответы: #59

56. Сообщение от gregg (?), 12-Янв-20, 00:49   +1 +/
>> Тыкаю в скачанный apk. Пытается поставить, потом молча пишет "не установлено". Как
>> поставить, чтобы была видна ошибка?
> Такое есть?
> Menu > Settings > Applications and make sure “Unknown sources” is checked

Да, поставлена галка. Андроид 5.1.1

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #38 Ответы: #57, #78

57. Сообщение от nshmyrev (ok), 12-Янв-20, 00:51   +2 +/
>>> Тыкаю в скачанный apk. Пытается поставить, потом молча пишет "не установлено". Как
>>> поставить, чтобы была видна ошибка?
>> Такое есть?
>> Menu > Settings > Applications and make sure “Unknown sources” is checked
> Да, поставлена галка. Андроид 5.1.1

logcat осилите собрать? adb logcat.

или загрузить проект в android studio и оттуда запустить.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #56

58. Сообщение от Аноним (58), 12-Янв-20, 00:59   +/
Почему именно 16 kHz в примере?

1. Пробовал записать wav файл с микрофона командой `arecord -vv -fdat test.wav` (48 kHz)

2. Заменил в примере 16000 на 48000

3. Скормил wav-файл скрипту, в результате удалось распознать только одну букву

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #60, #85

59. Сообщение от Аноним (47), 12-Янв-20, 01:03   +2 +/
Понятно. Извиняюсь. Спасибо за информацию.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #55

60. Сообщение от nshmyrev (ok), 12-Янв-20, 01:07   +1 +/
> Почему именно 16 kHz в примере?
> 1. Пробовал записать wav файл с микрофона командой `arecord -vv -fdat test.wav`
> (48 kHz)
> 2. Заменил в примере 16000 на 48000
> 3. Скормил wav-файл скрипту, в результате удалось распознать только одну букву

В исходниках там ожидается 16000, 48000 работать не будет, надо перекодировать. Можно `arecord -r 16000`, можно потом с помощью sox перекодировать.

Либо в исходниках исправить 16000 на KaldiRecognizer(model, 48000)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #58 Ответы: #61

61. Сообщение от nshmyrev (ok), 12-Янв-20, 01:11   +1 +/
>> Почему именно 16 kHz в примере?
>> 1. Пробовал записать wav файл с микрофона командой `arecord -vv -fdat test.wav`
>> (48 kHz)
>> 2. Заменил в примере 16000 на 48000
>> 3. Скормил wav-файл скрипту, в результате удалось распознать только одну букву
> В исходниках там ожидается 16000, 48000 работать не будет, надо перекодировать. Можно
> `arecord -r 16000`, можно потом с помощью sox перекодировать.
> Либо в исходниках исправить 16000 на KaldiRecognizer(model, 48000)

Ещё надо проконтролировать mono/stereo, стерео работать не будет.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #60 Ответы: #87

62. Сообщение от анонимуслинус (?), 12-Янв-20, 02:03   +2 +/
с этим и японцы плачут.)) недаром они спрашивают , да и объясняют что значит имя и как пишется)) но штука интересная надо смотреть.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #14 Ответы: #138

63. Сообщение от Константавр (ok), 12-Янв-20, 02:35   +/
На что не хватит? Старые движки на кофеварках работают.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #51

64. Сообщение от KonstantinB (??), 12-Янв-20, 03:05   +/
для совсем слепых, мне кажется, мак с его мультитачем будет удобнее - там есть voiceover gestures.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #52

65. Сообщение от Аноним (65), 12-Янв-20, 03:24   +/
Попробовал - дико круто!
Такую штуку бы с каким-нибудь Tasker подружить и уже можно было бы какие-то сценарии писать
Ответить | Правка | Наверх | Cообщить модератору

66. Сообщение от groosha (?), 12-Янв-20, 03:40   +/
По состоянию на май 2019 года на SDK 20 (Android 4.4) и ниже приходилось около 10% устройств.
https://developer.android.com/about/dashboards

Им уже больше 5 лет, закопайте стюардессу. Даже если бы ограничение по SDK 21+ было вызвано не плюсовыми библиотеками, а хотелкой автора, он всё равно прав.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #54 Ответы: #69, #83, #93

67. Сообщение от CrazyAlex (?), 12-Янв-20, 04:38   +3 +/
Ну, кому поржать, а я вот к управлению мультиметром прикрутить попробую.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16 Ответы: #92

68. Сообщение от Аноним (-), 12-Янв-20, 05:32   +/
> Python on Linux, Windows and RPi

Футыб%#!!! Автыры не смогли в нормальную либу с нормальным апи?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #70

69. Сообщение от Аноним (69), 12-Янв-20, 05:50   +6 +/
Ну так 10% устройств означает что каждый 10 юзер имеет основания махать факом. Это, типа, мало?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66 Ответы: #79

70. Сообщение от Аноним (71), 12-Янв-20, 06:17   +7 +/
На Python там лишь обёртка для собранной библиотеки.
Просьба в дальнейшем воздержаться от преждевременного гавканья в комментариях, пока не разберёшься что к чему.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #68

71. Сообщение от Аноним (71), 12-Янв-20, 06:19   +2 +/
Гляньте RHVoice. Весит немного, работает быстро, но русская (и не только) речь довольно качественная для столь небольшого движка.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #33

72. Сообщение от Аноним (72), 12-Янв-20, 06:23   +/
> Ожидается поддержка испанского, хинди, арабского и португальского.

А японский?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #81

73. Сообщение от Аноним (71), 12-Янв-20, 06:38   +1 +/
Это про обучение моделей, а не про само распознавание.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #46

74. Сообщение от Аноним (74), 12-Янв-20, 07:40   +1 +/
на спектруме тоже не взлетело
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2

76. Сообщение от Организация Объединённых Тюленей (?), 12-Янв-20, 08:50   +/
Faru gxin vi mem.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #24

77. Сообщение от Суп из потрошков (?), 12-Янв-20, 09:09   +2 +/
К тебе уже выехали из КГБ нравов.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #32

78. Сообщение от Суп из потрошков (?), 12-Янв-20, 09:10   –3 +/
А чего не 4?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #56 Ответы: #108

79. Сообщение от Суп из потрошков (?), 12-Янв-20, 09:12   +1 +/
У меня 10 ведро и я махаю вам этим самым. Можно?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #69 Ответы: #96

80. Сообщение от Суп из потрошков (?), 12-Янв-20, 09:14   +/
Отаку? Смотришь онимэ без субтитров?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #14 Ответы: #119

81. Сообщение от Vas Yan (?), 12-Янв-20, 09:54   +/
А также суахили и язык Навахо.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #72 Ответы: #82, #107

82. Сообщение от Аноним (5), 12-Янв-20, 10:12   –1 +/
> А также суахили и язык Навахо.

Ваш сарказм неуместен мне кажется https://en.wikipedia.org/wiki/List_of_languages_by_number_of...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #81 Ответы: #97

83. Сообщение от Аноним (47), 12-Янв-20, 11:19   +/
Толсто.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66

84. Сообщение от Я (??), 12-Янв-20, 11:22   +/
поставилась, работает.
приятно, что ест не так много ресурсов - соня не нагрелась.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2

85. Сообщение от Анонъ (?), 12-Янв-20, 11:25   +1 +/
Наверно, потому что голосовой диапазон такой, когда-то и 4кГц было норм. Зачем грузить проц лишними данными.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #58 Ответы: #130

86. Сообщение от Аноним (86), 12-Янв-20, 12:16   +/
дедушка с android-1.0 на nokia. это все что нужно знать про этого анонима.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #47

87. Сообщение от Аноним (58), 12-Янв-20, 12:26   +2 +/
Да, все получилось! Распознает достаточно точно, отличная либа.

p.s.: если стрипнуть `_vosk.so`, то можно сэкономить ~140mb (150mb -> 11mb)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #61 Ответы: #88, #89

88. Сообщение от Аноним (58), 12-Янв-20, 12:35   +/
Хотя слово "тест" не хочет ни в какую распознавать.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #87

89. Сообщение от nshmyrev (ok), 12-Янв-20, 12:46   +2 +/
> Да, все получилось! Распознает достаточно точно, отличная либа.
> p.s.: если стрипнуть `_vosk.so`, то можно сэкономить ~140mb (150mb -> 11mb)

Отлично, да, в следующий раз добавлю strip в сборку.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #87

90. Сообщение от x0r (??), 12-Янв-20, 12:54   +/
https://github.com/alphacep/vosk-api/issues/13
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #91

91. Сообщение от nshmyrev (ok), 12-Янв-20, 13:23   +/
> https://github.com/alphacep/vosk-api/issues/13

Спасибо за тестирование, ответил на гитхабе

Под винду скоро сделаем сборку, надо appveyor освоить.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #90 Ответы: #112

92. Сообщение от JL2001 (ok), 12-Янв-20, 13:26   +/
> Ну, кому поржать, а я вот к управлению мультиметром прикрутить попробую.

у вас мультиметр с андройдом/ линуксом и микрофоном? или это какой-то usb-подключаемый?
ссылку на поглазеть бы

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #67 Ответы: #117

93. Сообщение от Аноним (93), 12-Янв-20, 14:29   +/
в Apple приложениях - до сих пор IOS 8 поддерживают.
А когда он вышел ? 2014 год, то есть 6 лет назад - может стоит откопать стюардессу и сказать что кто-то требует покупать постоянно новые устройства ?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66 Ответы: #131

96. Сообщение от Злостный Анон (?), 12-Янв-20, 15:36   +/
Ну, Дунька, ты и дура - не можешь ты этим махать.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #79

97. Сообщение от Злостный Анон (?), 12-Янв-20, 15:39   +2 +/
В очередь, леди, в очередь.

Пусть япона-мама проспонсирует этот проект, тогда и поговорим.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #82 Ответы: #116

99. Сообщение от Аноним (99), 12-Янв-20, 17:17   +1 +/
Не ставится:

$ pip3 install vosk
Collecting vosk
  Could not find a version that satisfies the requirement vosk (from versions: )
No matching distribution found for vosk

Чего ему не хватает?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #100

100. Сообщение от Аноним (99), 12-Янв-20, 17:24   +1 +/
Вдогонку:
$ python3 --version
Python 3.6.9
$ pip3 --version
pip 9.0.1 from /usr/lib/python3/dist-packages (python 3.6)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #99 Ответы: #101

101. Сообщение от nshmyrev (ok), 12-Янв-20, 17:30   +/
> Вдогонку:
> $ python3 --version
> Python 3.6.9
> $ pip3 --version
> pip 9.0.1 from /usr/lib/python3/dist-packages (python 3.6)

pip 9 вроде manylinux2010 не поддерживает, что если попробовать

pip3 install pip --upgrade

сначала?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #100 Ответы: #102

102. Сообщение от Аноним (99), 12-Янв-20, 17:37   +/
В Убунту 18.04 обновлять pip можно только через apt, где доступен только 9.0.1. Иначе ломается.

Именно это у меня и произошло:

$ pip3 install pip --upgrade
Collecting pip
  Downloading https://files.pythonhosted.org/packages/00/b6/9cfa56b4081ad1... (1.4MB)
    100% |████████████████████████████████| 1.4MB 606kB/s
Installing collected packages: pip
Successfully installed pip-19.3.1

$ pip3 install vosk
Traceback (most recent call last):
  File "/usr/bin/pip3", line 9, in <module>
    from pip import main
ImportError: cannot import name 'main'

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #101 Ответы: #103

103. Сообщение от nshmyrev (ok), 12-Янв-20, 17:42   +/
Не ломается, просто старый надо удалить, его bash подхватывает ошибочно. После обновления можно

/usr/local/bin/pip3 install vosk

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #102 Ответы: #104

104. Сообщение от nshmyrev (ok), 12-Янв-20, 17:47   +/
Вот тут ещё много советов на разный вкус:

https://stackoverflow.com/questions/28210269/importerror-can...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #103 Ответы: #113

106. Сообщение от QQQQ (?), 12-Янв-20, 18:44   +/
Что-то я не понял, точность всего 48.57%? Как так если системы распознавания образов в компьютерном зрении имеют уже больше 95% точность, почему тут такая низка тончость?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #37 Ответы: #109, #129

107. Сообщение от QQQQ (?), 12-Янв-20, 18:49   +/
К сожалению язык перуанских индецев им никак не добавить. Один путешественник лингвист жаловался, что когда у этих индейцев умирает вожд они забывают слово которым звали вождя и ему приходилось часто переделывать словарь который он составлял вплот до переделки каждые два месяца.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #81

108. Сообщение от Ан оНим (?), 12-Янв-20, 19:18   +2 +/
А работает идеально.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #78

109. Сообщение от Annoynymous (ok), 12-Янв-20, 19:21   +/
Потому что маленькая библиотека звуков. Чем больше библиотека — тем меньеше ошибка.

Всегда ваш, К.О.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #106

110. Сообщение от Ан оНим (?), 12-Янв-20, 19:23   +2 +/
Угу. Попытка читать релиз нотсы ооочень подводит к этой идее.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #26

111. Сообщение от Annoynymous (ok), 12-Янв-20, 19:23   +/
Добавить бы эту библиотечку в какую-нибудь опенсорсную клавиатуру для Android, была бы тема. Кто возьмётся?
Ответить | Правка | Наверх | Cообщить модератору

112. Сообщение от Данил (??), 12-Янв-20, 20:28   +/
Не подскажете на каких русскоязычных датасетах вы обучали вашу модель?  
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #91

113. Сообщение от Аноним (99), 12-Янв-20, 20:59   +/
Спасибо, 1-й совет сработал. vosk поставился.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #104

115. Сообщение от Аноним (115), 12-Янв-20, 22:13   +/
Samsung Galaxy J2 андроид 7.1.1 устанлвилось нлрмально, но интерфейс "спартанский" тестовый , и мой голос распознает с ошибками, очень приблизительно
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #118

116. Сообщение от Аноним (5), 12-Янв-20, 22:17   –1 +/
> В очередь, леди, в очередь.
> Пусть япона-мама проспонсирует этот проект, тогда и поговорим.

Никогда этого не случится, и я их прекрасно понимаю. Очень всё плохо с поддержкой cjk в открытых системах.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #97

117. Сообщение от CrazyAlex (?), 12-Янв-20, 22:28   +1 +/
Нет, у меня старенький HP, который умеет управляться по GPIB. А переходник на GPIB тривиально делается из ардуинки.

Впрочем, новых модных USB-подключаемых вроде тоже хватает, но я не интересовался. Сейчас вообще подобного хватает - ЛБП те же.

Хм, а общий выключатель, срабатывающий по команде "гаси всё н@x" тоже, пожалуй, будет неплохой идеей

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #92 Ответы: #120, #135

118. Сообщение от nshmyrev (ok), 12-Янв-20, 22:28   +/
> Samsung Galaxy J2 андроид 7.1.1 устанлвилось нлрмально, но интерфейс "спартанский" тестовый
> , и мой голос распознает с ошибками, очень приблизительно

Можно сделать запись в файл, я посмотрю.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #115 Ответы: #122, #151

119. Сообщение от анонимуслинус (?), 12-Янв-20, 22:29   +/
у нас эта культура как то не сильно прижилась. хотя да учить японский по аниме проще)) пример реальной речи за бесплатно. а с правильными сабами так ваще огонь)) и я имею ввиду именно реальной речи, а не той что в учебниках. но русский все равно сложнее. ))
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #80 Ответы: #141, #142

120. Сообщение от анонимуслинус (?), 12-Янв-20, 22:31   +/
это к инженерам умного дома. но они тож ох""ревать будут.))
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #117 Ответы: #121

121. Сообщение от CrazyAlex (?), 12-Янв-20, 22:35   +/
Не, это я применительно к своей возне с электроникой. В умном доме посложнее надо, а тут - примитива хватит. В принципе я для мультиметра сфинкса хотел использовать, а тут такой подарок
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #120

122. Сообщение от Аноним (122), 12-Янв-20, 22:57   +/
Не нашел как в программе записать лог, записал видео с процессом
https://yadi.sk/i/61FY7hiOWfwibQ
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #118 Ответы: #123

123. Сообщение от nshmyrev (ok), 12-Янв-20, 23:09   +/
> Не нашел как в программе записать лог, записал видео с процессом
> https://yadi.sk/i/61FY7hiOWfwibQ

Ну норм, одно слово пропустил всего. Задержка есть, надо нейросетку оптимизировать ещё.

А где с ошибками-то?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #122 Ответы: #124

124. Сообщение от Аноним (122), 12-Янв-20, 23:27   +/
Молодцы! разработка прекрасная, буду думать как ее внедрить.

Про ошибки распознавания: я слишком требователен ))

Из тестов, что не попали в запись, было больше ошибок. Из плюсов: слово редкое по звучанию ("математика") распознавалось надежно, когда несколько созвучных слов было - ошибки были ))

Давно искал подобную офф-лайн библиотеку, надо бы программу на свой специальный словарь натренировать, чтобы на ключевых отраслевых словах не ошибалась.


Ответить | Правка | Наверх | Cообщить модератору
Родитель: #123 Ответы: #125

125. Сообщение от nshmyrev (ok), 12-Янв-20, 23:35   +/
> Молодцы! разработка прекрасная, буду думать как ее внедрить.
> Про ошибки распознавания: я слишком требователен ))
> Из тестов, что не попали в запись, было больше ошибок. Из плюсов:
> слово редкое по звучанию ("математика") распознавалось надежно, когда несколько созвучных
> слов было - ошибки были ))
> Давно искал подобную офф-лайн библиотеку, надо бы программу на свой специальный словарь
> натренировать, чтобы на ключевых отраслевых словах не ошибалась.

Хорошо, тренировать можно. Попозже выложим скрипты. Обращайтесь.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #124 Ответы: #126, #153

126. Сообщение от Аноним (122), 12-Янв-20, 23:39   +/
Спасибо! ))
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #125

127. Сообщение от хотел спросить (?), 13-Янв-20, 03:05   +1 +/
А сырцы где? На гитхабе написано, что это байндинги.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #128

128. Сообщение от KonstantinB (??), 13-Янв-20, 03:15   +/
Если вбить в гугл то, на что binding-и, первые же ссылки будут на сорцы.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #127

129. Сообщение от corvuscor (ok), 13-Янв-20, 04:44   +1 +/
WER сиречь Word Error Rate. Например.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #106

130. Сообщение от Аноним (-), 13-Янв-20, 06:53   +/
> Наверно, потому что голосовой диапазон такой, когда-то и 4кГц было норм.

Вообще-то 8. Потому что человеческий голос до примерно 4кГц. И то - с "телефонным" качеством. Это тех древних штук, где голос как из унитаза.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #85

131. Сообщение от iPony129412 (?), 13-Янв-20, 06:58   +/
Пошёл смотреть...
Случайная (вообще нет, ибо первое, что вспомнил просто из приложений):
My Little Pony (игра) - iOS 9
Evernote (заметки) - iOS 11
Termius (ssh клиент) - iOS 10

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #93

132. Сообщение от Аноним (132), 13-Янв-20, 09:11   +/
Так а как хотя бы ввести что-то в текстовик или поисковик голосом с помощью этого? На Андроиде
Ответить | Правка | Наверх | Cообщить модератору

133. Сообщение от Аноним (132), 13-Янв-20, 09:21   +/
в эстонскую Konele можно добавить в f-droid уже есть
Ответить | Правка | Наверх | Cообщить модератору

134. Сообщение от Аноним (134), 13-Янв-20, 10:18   +/
Нужно
Ответить | Правка | Наверх | Cообщить модератору

135. Сообщение от sdkisik (?), 13-Янв-20, 10:24   +/
>переходник на GPIB тривиально делается из ардуинки.

Не поделитесь ссылкой?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #117 Ответы: #136

136. Сообщение от CrazyAlex (?), 13-Янв-20, 11:18   +1 +/
https://github.com/Twilight-Logic/AR488
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #135

137. Сообщение от Аноним (137), 13-Янв-20, 18:55   +1 +/
Оффлайн распознавалка голоса? Неужели дождались. А то всё питоно-электроно-монстры на 800 мегабайт, являющеся оболочкой над Google Assistant.
Ответить | Правка | Наверх | Cообщить модератору

138. Сообщение от Аноним (138), 14-Янв-20, 05:14   +/
Они спрашивают из-за иероглифов - есть много способов записать одни и те же звуки (типа яблоко и йаблоко), плюс все иероглифы имеют по несколько значений. И родители с этим всем любят изгаляться по всякому, когда дают имя ребёнку.
С обычными словами у них всё более-менее понятно, хотя иероглифы усложняют письменность. Кстати, эти иероглифы (около 5 тысяч всего) им нужны только потому, что они слова без пробелов пишут :)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #62

139. Сообщение от DmA (??), 14-Янв-20, 08:29   +/
Неужели сбылось то, что обещала 25 лет назад OS/2 Warp -голосовое управление компьютером :)
Ответить | Правка | Наверх | Cообщить модератору

140. Сообщение от Cadet (?), 14-Янв-20, 09:32   +/
Интересно, это лучше, чем обученный русскому Dragon NaturallySpeaking?
Для оффтопика русские разрабатывают Voco. Вроде бы бесплатно не найти. Системные требования i5, 4Gb RAM, стоимость 1700-14000руб, зависит от версии. А в сабже размер всего 50 мб.
Сделали ли бы прогу для автоматического титрования фильмов. Пусть даже если криво, потом можно исправить ошибки.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #144

141. Сообщение от Cadet (?), 14-Янв-20, 09:43   +/
>у нас эта культура как то не сильно прижилась

Зато аниме прижилось.
И рок.
Типичный пример увлечения молодежи.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #119 Ответы: #147

142. Сообщение от Cadet (?), 14-Янв-20, 10:08   +/
У нас прижились говноозвучки. Я вот не представляю себе, чтобы какой-нибудь рядовой американец взялся озвучивать фильм (да еще выкладывать в безальтернативном порядке). Еще у нас водится такое явление, как закадровый перевод. Который можно встретить разве что в Польше (но там обычно один диктор). В мире царствуют дубляж и субтитры. Дубляж делают редко и в основном для детей. Правда, немцы любят дублировать все подряд и довольно неплохо. Может, потому что там сильна русская культура?

Я уже смотрю французские и немецкие фильмы вообще без перевода. Предварительно посмотрев с ним, конечно. С возрастом озвучки вообще разлюбил, даже профессиональные. А уж дубляжи та еще приторная гадость.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #119

143. Сообщение от pofigist (?), 14-Янв-20, 14:28   +/
RealDoll с распознованием речи :)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8

144. Сообщение от Crazy Alex (??), 14-Янв-20, 18:15   +1 +/
Наоборот - какой смысл в указанной вами проприетарщине, если вот оно - открытое, вполне приемлемо жрущее и неплохо распознающее?

Что до субтитров - это тривиально делается скриптами, я так, помнится, свою коллекцию обучающих видео обрабатывал, чтобы индекс создать для локального поиска. Типа этого: https://github.com/agermanidis/autosub - при желании можно заменить там гугловскую распознавалку на сабж или любую другую альтернативу. Качество выходит дрянь, но для индекса - достаточно.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #140 Ответы: #148

145. Сообщение от Zedemail (??), 14-Янв-20, 21:20   +/
На старые дроиды принципиально не дают ставить или же есть объективные причины?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #146

146. Сообщение от nshmyrev (ok), 14-Янв-20, 22:09   +2 +/
> На старые дроиды принципиально не дают ставить или же есть объективные причины?

На старых NDK были проблемы с libstdc++ в части математических функций вроде такой.

https://eigen.tuxfamily.org/bz/show_bug.cgi?id=876

В принципе, можно собрать с небольшим напильником, но лень.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #145

147. Сообщение от axredneck (?), 14-Янв-20, 23:16   +/
> И рок

Скорее уж рэп
(сам слушаю металл)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #141

148. Сообщение от Аноним (148), 15-Янв-20, 16:41   +/
Звучит интересно. Но на Ubuntu 16.04 не поставилось. Лог https://pastebin.com/raw/VB2CdGKk
Failed building wheel for unknown
Попробую на openSUSE Tumbleweed. Там пакеты свежее.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #144 Ответы: #149

149. Сообщение от Аноним (148), 15-Янв-20, 16:44   +/
Из под sudo можно запускать? А то что-то python pip знатно гадит в хомяк.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #148

150. Сообщение от chukcha (??), 16-Янв-20, 22:17   +/
А можно ли скрестить эту распознавалку речи с синтезатором речи?
Например, через | (конвеер).

Синтезаторов полно, начиная с "Festival" - http://linux.tiflocomp.ru/docs/ux_synths.php

В результате получится идеальный вокодер, в котором ваш голос уже точно никто не угадает!

Может, в этих "Быстро-новостях" голоса так и сделаны?
https://www.youtube.com/watch?v=-EEDEL63AR8

>

Ответить | Правка | Наверх | Cообщить модератору

151. Сообщение от Аноним (151), 19-Янв-20, 14:08   +/
а где взять серверные модели? не могу нагуглить
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #118 Ответы: #152

152. Сообщение от nshmyrev (ok), 19-Янв-20, 18:08   +/
> а где взять серверные модели? не могу нагуглить

Сервер:

https://github.com/alphacep/kaldi-websocket-python

Докер для сервера:

docker run -d -p 2700:2700 alphacep/kaldi-ru:latest

Модель русская:

http://alphacephei.com/kaldi/kaldi-ru-0.6.tar.gz

Модель английская:

http://alphacephei.com/kaldi/kaldi-en-us-aspire-0.1.tar.gz

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #151

153. Сообщение от de220175 (ok), 29-Янв-20, 21:37   +/
Очень впечатлила ваша работа. Есть желание потренировать вашу модель подскажите где найти скрипты для тренировки, ну или хотя бы укажите направление, с чего начать.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #125 Ответы: #154

154. Сообщение от nshmyrev (ok), 29-Янв-20, 22:23   +/
> Очень впечатлила ваша работа. Есть желание потренировать вашу модель подскажите где найти
> скрипты для тренировки, ну или хотя бы укажите направление, с чего
> начать.

Начать с изучения kaldi, наверное

https://kaldi-asr.org/doc/kaldi_for_dummies.html

https://github.com/kaldi-asr/kaldi/tree/master/egs/mini_libr...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #153

155. Сообщение от gregg (?), 13-Апр-20, 15:31   +/
На новой мобиле заработало. На андроид вполне приемлемое качество распознавания, и это при том, что рядом работает стиральная машина ))
@nshmyrev, скажите пожалуйста, а можно ли с помощью этой либы текст выводить в файл просто? Остро, отчаянно не хватает хотя бы простейшей оффлайн-распознавалки и под андроид, и под линукс. Прямо готов объявлять баунти, собирать людей в патреон и т.д.  
Сейчас ситуация с реально_работающим_под_линукс oss софтом для распознавания определяется словом "позор", по-моему. Даже то, что есть в репах, не имеет ни GUI, ни даже CLI интерфейса для простого юзера - я имею в ввиду такого интерфейса, где не нужно было бы задавать километр параметров. И это при том, что куча движков опубликована под свободными лицензиями, и датасетов уже немало.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #156

156. Сообщение от nshmyrev (ok), 13-Апр-20, 18:10   +/
> @nshmyrev, скажите пожалуйста, а можно ли с помощью этой либы текст выводить
> в файл просто? Остро, отчаянно не хватает хотя бы простейшей оффлайн-распознавалки
> и под андроид, и под линукс. Прямо готов объявлять баунти, собирать
> людей в патреон и т.д.
> Сейчас ситуация с реально_работающим_под_линукс oss софтом для распознавания определяется
> словом "позор", по-моему. Даже то, что есть в репах, не имеет
> ни GUI, ни даже CLI интерфейса для простого юзера - я
> имею в ввиду такого интерфейса, где не нужно было бы задавать
> километр параметров. И это при том, что куча движков опубликована под
> свободными лицензиями, и датасетов уже немало.

Можно в файл выводить, на то и библиотека. Под линуксом работает на питоне https://github.com/alphacep/vosk-api а также есть докер сервер:

https://github.com/alphacep/vosk-server

Недавно вышла большая модель с повышенной точностью:

http://alphacephei.com/kaldi/kaldi-ru-0.9.tar.gz

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #155

157. Сообщение от gregg (?), 13-Апр-20, 19:41   +/
Спасибо за ответ,
vosk-server не ставится через pip3 на bionic, но это, наверное, не ваша проблема ))
Ответить | Правка | Наверх | Cообщить модератору

158. Сообщение от gregg (?), 13-Апр-20, 19:41   +/
я хотел сказать, vosk-api не ставится на бионик (
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #159

159. Сообщение от nshmyrev (ok), 13-Апр-20, 20:13   +/
> я хотел сказать, vosk-api не ставится на бионик (

Почему не ставится? pip 19 обновлён?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #158

160. Сообщение от gregg (?), 14-Апр-20, 02:15   +/
pip3 --version
pip 20.0.2 from /usr/local/lib/python3.6/dist-packages/pip (python 3.6)
Если ввести pip3 install vosk то ставится пакет, в к-ром только _vosk.so - но мне-то нужен vosk-api, нет?
pip3 install vosk-api отвечает
ERROR: Could not find a version that satisfies the requirement vosk-api (from versions: none)
ERROR: No matching distribution found for vosk-api
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #161

161. Сообщение от nshmyrev (ok), 14-Апр-20, 09:57   +/
> pip3 --version
> pip 20.0.2 from /usr/local/lib/python3.6/dist-packages/pip (python 3.6)
> Если ввести pip3 install vosk то ставится пакет, в к-ром только _vosk.so
> - но мне-то нужен vosk-api, нет?
> pip3 install vosk-api отвечает
> ERROR: Could not find a version that satisfies the requirement vosk-api (from
> versions: none)
> ERROR: No matching distribution found for vosk-api

Это он и есть. можно запускать пример.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #160

162. Сообщение от gregg (?), 14-Апр-20, 15:24   +/
пример? в vosk есть только vosk.py (вы с чайником разговариваете, если что ))
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #163

163. Сообщение от nshmyrev (ok), 14-Апр-20, 20:14   +/
> пример? в vosk есть только vosk.py (вы с чайником разговариваете, если что
> ))

Пример тут https://github.com/alphacep/vosk-api/blob/master/python/exam...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #162

164. Сообщение от gregg (?), 15-Апр-20, 00:44   +/
Traceback (most recent call last):
  File "./test_simple.py", line 12, in <module>
    wf = wave.open(sys.argv[1], "rb")
IndexError: list index out of range
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #165

165. Сообщение от nshmyrev (ok), 15-Апр-20, 03:23   +/
Файл ему нужно было указать в качестве аргумента, это в readme написано:

ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
./test_simple.py file.wav

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #164

166. Сообщение от gregg (?), 16-Апр-20, 12:35   +/
В общем, жду и мечтаю, что кроме test_simple.py там будет лежать ещё notepad_simple.py ))
Ответить | Правка | Наверх | Cообщить модератору

167. Сообщение от Аноним (167), 27-Июн-20, 16:14   +/
Распознает офигительно. Во влажных мечтах прикрутить к управлению умным домом.
Ответить | Правка | Наверх | Cообщить модератору

168. Сообщение от Вячеславemail (??), 28-Авг-20, 07:51   +/
Не могу установить vosk.
Имею
Win7 prof,64 разряда
Python 3.6.7 (v3.6.7:6ec5cf24b7, Oct 20 2018, 13:35:33) [MSC v.1900 64 bit (AMD64)] on win32
pip 20.2.2

при попытке установки
pip -v install vosk
выдает ошибки
ERROR: Could not find a version that satisfies the requirement vosk-api (from versions: none)
ERROR: No matching distribution found for vosk-api

при попытке установки
pip install https://github.com/dtreskunov/tiny-kaldi/releases/download/0...
выдает ошибку
ERROR: vosk-0.3.1.2-cp37-cp37m-win_amd64.whl is not a supported wheel on this platform

соответственно при попытке импорта
from vosk import Model, KaldiRecognizer
ModuleNotFoundError: No module named 'vosk'

Что не так?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #170

169. Сообщение от Вячеславemail (??), 28-Авг-20, 08:08   +/
после написания своего поста тупо начал перебирать версии с https://github.com/dtreskunov/tiny-kaldi/releases
версия
https://github.com/dtreskunov/tiny-kaldi/releases/download/0...
вроде загрузилась без ошибок.
продолжаю тестировать
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #171

170. Сообщение от nshmyrev (ok), 28-Авг-20, 10:02   +/
Под Windows поддерживается только Python 3.8 64-bit, 3.6 не поддерживается.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #168

171. Сообщение от nshmyrev (ok), 28-Авг-20, 10:02   +/
> после написания своего поста тупо начал перебирать версии с https://github.com/dtreskunov/tiny-kaldi/releases
> версия
> https://github.com/dtreskunov/tiny-kaldi/releases/download/0...
> вроде загрузилась без ошибок.
> продолжаю тестировать

Это очень старая, к тому же, неофициальная версия.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #169

172. Сообщение от Вячеславemail (??), 28-Авг-20, 11:09   +/
Не работает. При запуске примера возникает ошибка: from . import _vosk ImportError: DLL load failed: Не найден указанный модуль. Есть решение?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #173

173. Сообщение от nshmyrev (ok), 28-Авг-20, 22:17   +/
> Не работает. При запуске примера возникает ошибка: from . import _vosk ImportError:
> DLL load failed: Не найден указанный модуль. Есть решение?

1) Запустить python -v чтобы увидеть более подробную информацию о модулях
2) Убедиться, что файл с кодом не называется vosk.py, питон его перепутывает с установленным системным модулем.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #172

174. Сообщение от Вячеславemail (??), 30-Авг-20, 04:20   +/
установил Python 3.8.5, установил
pip install https://github.com/dtreskunov/tiny-kaldi/releases/download/0...
не хотело ставиться PyAudio, нашел способ...
pip install pipwin
pipwin install PyaAdio
вроде все готово... начало ругаться на отсутствие файлов в модели.
использую легкую модель https://alphacephei.com/vosk/models/vosk-model-ru-0.10.zip
легкая модель распакована как сказано в ролике https://www.youtube.com/watch?feature=youtu.be&v=fPKAOeUo-Rg...
перекинул все файлы из папок модели в папку model, код запустился и повис :( не вылетел, а повис как выяснилось на строке model = Model("model")
дальше не знаю пока чего делать :(


Ответить | Правка | Наверх | Cообщить модератору
Ответы: #175

175. Сообщение от nshmyrev (ok), 30-Авг-20, 11:55   +/
> установил Python 3.8.5, установил
> pip install https://github.com/dtreskunov/tiny-kaldi/releases/download/0...

Это старая версия. Надо

pip3 install vosk

или

pip3 install https://github.com/alphacep/vosk-api/releases/download/0.3.7...

> не хотело ставиться PyAudio, нашел способ...
> pip install pipwin
> pipwin install PyaAdio
> вроде все готово... начало ругаться на отсутствие файлов в модели.
> использую легкую модель https://alphacephei.com/vosk/models/vosk-model-ru-0.10.zip

Это большая модель, маленькая тут:

https://alphacephei.com/vosk/models/vosk-model-small-ru-0.4.zip

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #174

176. Сообщение от Alex (??), 28-Сен-20, 22:45   +/
Добрый день!

Вопрос по VOSK

Движок поддерживает режим по ключевый словам, по типу, как это реализрванно в Сфинксе?

https://cmusphinx.github.io/wiki/tutoriallm/#keyword_lists

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #177

177. Сообщение от nshmyrev (ok), 28-Сен-20, 23:43   +/
> Добрый день!
> Вопрос по VOSK
> Движок поддерживает режим по ключевый словам, по типу, как это реализрванно в
> Сфинксе?
> https://cmusphinx.github.io/wiki/tutoriallm/#keyword_lists

Нет, пока не поддерживает.

https://github.com/alphacep/vosk-api/issues/107

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #176

178. Сообщение от Аноним (178), 16-Ноя-20, 23:35   +/
Здравствуйте. Установил vosk на linux все прекрасно работает. Понадобилось использовать его на Windows 10 возникли проблемы. Версия windows 64-битная. Python версии 3.9.0. pip3 версия 20.2.4. Однако после команды pip3 install vosk выдает ошибку:
ERROR: Could not find a version that satisfies the requirement vosk (from versions: none)
ERROR: No matching distribution found for vosk
Не знаю как решить данную проблемы, если кто-то с таким сталкивался, может подсказать что-то?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #179

179. Сообщение от nshmyrev (ok), 17-Ноя-20, 02:21   +/
> Здравствуйте. Установил vosk на linux все прекрасно работает. Понадобилось использовать
> его на Windows 10 возникли проблемы. Версия windows 64-битная. Python версии
> 3.9.0. pip3 версия 20.2.4. Однако после команды pip3 install vosk выдает
> ошибку:
> ERROR: Could not find a version that satisfies the requirement vosk (from
> versions: none)
> ERROR: No matching distribution found for vosk
> Не знаю как решить данную проблемы, если кто-то с таким сталкивался, может
> подсказать что-то?

Пока под Windows поддерживается только Python версия 3.8. И то мне её обновить надо, много исправлений не вошло.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #178

180. Сообщение от Денисemail (??), 21-Янв-22, 11:38   +/
Установил библиотеку Python, скачал базу, как это использовать? ОС Linux Mint 20.3
Ответить | Правка | Наверх | Cообщить модератору


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру