Эта книжно-компьютерная история началась несколько лет назад. Раньше все было привычно и понятно. Идем на книжный рынок, судорожно сглатываем слюну (куда все это поставить? и когда читать? и что потом делать с этой горой макулатуры?), покупаем пару книг и, довольные, втискиваем их на полку.

 

В одночасье все смешалось. Рядом с солидными дядями, предлагающими толстые тома, появились молодые люди, предлагающие компакт-диски. И на каждом таком диске - ассортимент целого книжного рынка. Что с того, что дядя прочел в десятки раз больше, чем продает, а молодой человек - в лучшем случае лишь надписи на коробке! Зато приходишь домой с целой библиотекой в кармане.

 

Одно плохо: читать приходится с экрана. Один мой знакомый так увлекся электронной литературой, что просиживал перед монитором целые дни. Запойное чтение привело к тому, что он украсил свой нос замечательными очками… Другой приятель приобрел ЖК-монитор.

 

Мы же пошли другим путем.

 

Программа

Speaking Mouse

Govorilka

ToM Reader

Разработчик

Клуб голосовых технологий научного парка МГУ

Антон Рязанов

A. Kvitko aka PeTRoViCH

Версия

1991-1995 г.

1.46b

2.7

Условия приобретения

условно бесплатно

бесплатно

бесплатно

Объем архива

430 Кб

442 Кб

621 Кб

Домашняя страница

http://art.bdk.com.ru/govor/Spmouse.htm

http://www.vector-ski.ru/vecs/govorilka/

http://tomreader.narod.ru/index2.html

Адрес архива

 http://art.bdk.com.ru/govor/download/spmause.zip

http://www.vector-ski.ru/vecs/govorilka/Govorilka146rus.zip

http://tomreader.narod.ru/tom_setup.zip

Язык интерфейса

англ.

рус.

рус.

Преобразование в MP3

нет

да

да

Нужны ли внешние модули синтеза речи

нет

да

да

 

Говорящая мышь

 

Первым этапом "другого пути" стала "Говорящая мышь для дома" версии 4.5. Эта программа представляет собой речевой синтезатор. Интерфейс предельно прост - окно для ввода текста, спартанская панель меню и две кнопки, как на магнитофоне,- стоп/пуск и пауза.

 

 

Программа работает так: анализирует введенный в нее текст (проще всего это делать через буфер обмена, так как в хитросплетениях текстовых форматов "Говорящая мышь" не сильна), а потом начинает говорить…

 

Передавать словами голос Мыши - все равно что описывать знаменитый смешок Вуди Вудпекера. Это надо слышать. Вообще-то у Мыши несколько голосов: Диктор, Фараон, Петрович, Гремлин, Кинг-Конг, Мышь, Эльфы и Титан. Но нормально слушать можно только Диктора. Похоже, остальная веселая компания была создана авторами прикола ради.

 

Однако шутки в сторону. Даже сейчас, после выхода новых версий, произношение и интонации Диктора вызывают у меня огромное уважение к его авторам. Мышь вполне адекватно воспроизводит паузы, понижение и повышение тембра при чтении сложных предложений с запятыми, двоеточиями и кавычками.

 

Что же касается ударений, то по этому поводу я всегда сочувствовала иностранцам, изучающим русский язык… Это нельзя выучить, а можно только запомнить. Тем не менее, Мышь справляется с большинством ударений, а некоторым из редких казусов мы должны быть, скорее, благодарны подаренные ими веселые минуты. Чего стоит только реплика инженера Лося из "Аэлиты" в исполнении Мыши:

 

- Помираю, Мстислав Сергеевич, мочи нет.

 

В общем же Мышь читает достаточно четко и внятно, так что сносно слушаются не только деловые письма, но и художественная литература.

 

Для полноты картины и для того чтобы было с чем сравнивать другие программы, упомяну вкратце основные функции интерфейса. Это настройка тембра и скорости. Менять тембр нам так ни разу и не понадобилось, а вот со скоростью вышло интересно: со временем мы так привыкли к "мышиной" манере чтения, что теперь всегда включаем скорость на максимум. Это обеспечивает скорость чтения примерно 70 тыс. знаков в час. Не каждый похвастается таким скорочтением "глазами"!

 

Есть у мыши и другие любопытные свойства. Например, можно включить ее в режим слежения - и тогда она будет вслух сообщать, в какие окна переходит пользователь и какие команды выполняет. Еще можно создавать звуковые презентации - есть возможность отредактировать читаемый файл, расставив там специальные управляющие символ, так чтобы Мышь правильно ставила ударения и делала паузы не только там, где считает нужным она, но и там, где этого хотим мы.

 

Но это уже, пожалуй, экзотика. Главное - Мышь читает! Чтению предшествует некоторая пауза, во время которой Мышь анализирует предложенный ей текст и, вероятно, расставляет упомянутые выше управляющие последовательности в автоматическом режиме. Эта пауза довольно сильно зависит от размера текста и может продлиться до десятка секунд.

 

К сожалению, некоторые знаки, встречающиеся в текстах, вызывают у Мыши затруднения разной степени тяжести - от простого игнорирования до зависания программы. К "легким" можно отнести римские цифры. Их Мышь читает как набор английских букв: "Мы живем в экс-экс-ай веке".

 

Некоторые символы и сокращения она попросту игнорирует. К ним относятся: сокращение "г." (вместо "г. Киев" Мышь читает "Киев"), а также знак %, фигурные и угловые скобки, которыми в электронных письмах часто заменяют кавычки-"елочки". Да и вообще, с цифрами и сокращениями Мышь обращается подчас весьма вольно: пропускает куски, вместо одних чисел говорит другие. Все это, конечно, не добавляет доверия ей - особенно в ответственных случаях.

 

В относительно новой (последней из доступных) версии Мыши, датированной 1995 г., эти недостатки частью сохранились, частью изменились - но, увы, не к лучшему. Мышь перестала произносить римские цифры как английские аббревиатуры. Она теперь пытается читать их как слова - причем на странной смеси русского и английского: "ххи век", "глава ви" (надеюсь, вы догадались, что в тексте стояло "глава VI"). Зато "г. Киев" она произносит именно так, как написано, ничего не пропуская. Прогресс налицо, хотя я в корне не согласна с мнением Мыши об этом городе. То же самое касается и спецсимволов: содержимое скобок и кавычек Мышь воспроизводит правильно, однако знак процента по-прежнему игнорирует.

 

Заметно улучшилась и расстановка ударений. Для проверки мы выбрали словосочетания, интерпретацией которых нас в свое время немало насмешила старая Мышь: "Степан Аркадьевич" (Облонский из "Анны Карениной", которого она упорно именовала Степаном Аркадьевичем), "трубка табаку", постоянно фигурировавшая в рассказах Джека Лондона (которую мы вслед за Мышью еще долго будем называть "трубкой табаку"), и уже упоминавшаяся выше незабвенная фраза из "Аэлиты" в паре с "анализом мочи". Новая Мышь хорошо справилась со всеми ударениями, за исключением все той же "Аэлиты" и обоих имен: эти герои русской классики для нее по-прежнему остаются Степаном и Мстиславом.

 

Изменились и мышиные голоса. Эльфы, гремлины и прочая сказочная братия исчезли. Зато появились вполне внятные голоса мужчины, женщины, девочки и мальчика - и еще два голоса, которые в английском интерфейсе называются Giant и Large. К моему сожалению, вместе в эльфами пропал и Диктор.

 

Какой из новых голосов лучше? Думаю, это дело вкуса. Мне больше всех пришелся по душе Large - особенно если подстроить тембр и скорость. Кстати о скорости: при тех же десяти градациях ее верхний порог значительно повысился. Разобрать текст на скорости 9 совершенно невозможно. Нормальный темп - как и тембр - находится где-то в районе семерки. Вот только жаль, что новая Мышь, как и старая, не сохраняет настроек. Приходится при каждом запуске выставлять скорость и тембр заново.

 

И, наконец, если "порция чтения" старой Мыши составляла около 38 тыс. знаков (именно столько помещалось в ее окне), то в пробной версии Мыши, скачанной из интернета, объем этой порции сократился до 10 тысяч, что совсем неудобно.

 

Итак, как бы то ни было, со своей главной задачей - чтением больших объемов текста - мышь справляется хорошо. И это вселяет оптимизм - ведь программы имеют свойство от версии к версии улучшаться.

 

Но не следует забывать, что Мышь - платная программа. Давайте сравним ее с другими синтезаторами речи.

 

Говорилка


У этой бесплатной программы гораздо больше функций, чем у Мыши. Прежде всего, у нее почти настоящий многооконный интерфейс - на три документа. Каждому из них на панели инструментов соответствует кнопка с номером. Конечно, не MS Word, но, с другой стороны, этого вполне достаточно. Тем более что в этих окнах сохраняются тексты, которые читались последними. И вообще, в отличие от Мыши, Говорилка сохраняет все настройки, сделанные на предыдущем сеансе работы: скорость, высоту, громкость, а также шрифт и цвет фона. Да-да, автор программы в своем эстетическом рвении дошел даже до того, что дал пользователю возможность настраивать эти параметры. Чем я немедленно воспользовалась, заменив резкое сочетание из черного фона и зеленого шрифта на более привычное "черным по белому".

 

 

Объем вводимого текста здесь тоже побольше - около 63,5 тыс. знаков. Однако - опять же, в отличие от Мыши, которой на анализ текста нужно какое-то время,- Говорилка начинает чтение практически сразу. Она анализирует текст небольшими порциями, делая для этого небольшие паузы по ходу работы. На слух они воспринимаются естественно - ведь и человек-чтец часто делает паузы, чтобы перевести дух. Кроме того, эти паузы совпадают с началом следующего абзаца и поэтому обычно не только не раздражают, но и являются уместными, так как усиливают "драматический" эффект.

 

Скорость, высота и громкость голоса имеют здесь гораздо больше градаций, чем в случае с Мышью. Скорость изменяется в диапазоне 80-218. К сожалению, в справочном руководстве не написано, что означают эти единицы - слогов в минуту получается больше, а слова имеют слишком разную длину, чтобы служить единицей измерения. То же самое касается загадочных значений высоты звука (68-105). Только с громкостью все более или менее логично: от 0 до 100. Менять настройки по ходу чтения, как это позволяла Мышь, нельзя - для того чтобы они вступили в силу, нужно прервать чтение и продолжить его снова.

 

Программа снабжена минимальными средствами борьбы с разнообразием текстовых форматов. Кроме обычных TXT, она позволяет открывать документы RTF, DOC, HTML, а для интернетовской добычи в ней предусмотрена перекодировка WIN-DOS. Для простейших случаев этого хватит, а в более тяжелых придется, как обычно, обращаться к специализированным программам вроде "Штирлица".

 

Хочется отметить еще две функции, на первый взгляд показавшиеся экзотикой - хотя по здравом размышлении с их логичностью нельзя не согласиться. Во-первых, это запись озвученного текста в формат MP3. Подобная функция была и у Мыши, но последняя записывала текст в собственный формат SPM. С одной стороны, это не бинарный, как MP3, а обычный текстовый файл с управляющими символами. Но, с другой стороны, ни одна программа, кроме Мыши, не может его озвучить. Говорилка же записывает текст в полноценный MP3 со всеми вытекающими последствиями.

 

Вторая любопытная функция - повтор вслух текста, вводимого с клавиатуры. Правда, Говорилка, особенно при быстром наборе, частенько запинается - и текст читается с пропусками. Но если бы эта функция работала нормально, появилась бы замечательная возможность следить за орфографией, не глядя на экран. А пока что я так и оставила ее включенной - Говорилка следовала за удлиняющимися строчками, будто верная собака, и было очень забавно слушать набираемый текст статьи в ее интерпретации.

 

Есть у Говорилки и собственный секундомер, по которому, по идее, можно измерить ее скорочтение. Однако он неточен: отстает от компьютерных часов.

 

Поскольку в окно Говорилки можно поместить довольно длинный текст, становится актуальным механизм закладок. У Мыши их просто нет, и соответствующую функцию приходится возлагать на Word или другой текстовый редактор. Но Говорилка сохраняет в своих окнах не только текст, но и информацию о том, на каком месте было прервано чтение. При открытии программы на этом месте стоит курсор. По мере чтения курсор передвигается, а прочитанный текст выделяется другим цветом и по мере необходимости сдвигается вверх, что позволяет следить за чтением и сверять по экрану невнятно прочитанные места, например даты и имена собственные.

 

Для борьбы с недостатками синтезаторов речи у Говорилки предусмотрен пользовательский словарь. Правда, расставить ударения, как у Мыши, здесь нельзя. Зато можно "научить" Говорилку правильно читать такие аббревиатуры как "н.э." или "г-н". Или, наконец, навести порядок с латинскими цифрами.

 

Общий вывод таков: интерфейс программы достаточно продуман, чтобы успешно использовать ее в качестве домашней "читалки". Кроме того, в Говорилку заложено несколько перспективных идей вроде словаря и автоматического повтора вводимых слов, чтобы она могла развиваться дальше. Главное для нее - как, впрочем, и для остальных программ этого типа - подобрать хороший модуль синтеза речи.

 

ToM Reader


Интерфейс этой программы имитирует раскрытую книгу: текст отображается на двух "разворотах". Фон имитирует шероховатую бумагу, посередине просматривается переплет на двух скрепках. Можно даже регулировать "освещение" - сделать его рассеянным или переместить "источник света" так, чтобы он находился над "книгой". Впрочем, все это скорее украшения, чем практически полезные функции - регулировать освещение при чтении с экрана нужно, но не так, как это делает ToM Reader, а гораздо серьезнее.

 

 

Гораздо полезнее другие, более обычные функции настройки - изменение размера и цвета шрифта, яркости фона. Если поставить яркость на минимум, книга примет вид старинного фолианта, а если на максимум - текстура бумаги и рисунок переплета станут невидимыми, и мы получим чистый белый фон, удобный для чтения. Также предусмотрена еще одна полезная возможность, которой нет в предыдущих программах,- изменение размеров вертикального и горизонтального полей.

 

 

Программа распознает текст в форматах TXT, DOC, RTF и HTML. К сожалению, документы в форматах, отличных от простого текста, иногда открываются с ошибками. Максимальный объем текста, поддерживаемый программой, составляет около 12 Мб.


Как и другие программы этого типа, ToM Reader позволяет записывать синтезированный текст в MP3-файл. Однако здесь возможности гораздо более широки - можно настраивать не только скорость записи и битрейт, но и некоторые дополнительные параметры. В частности, ToM Reader позволяет записать в MP3 не только весь текст, но и отдельные его фрагменты. Точки начала и конца записи вводятся очень удобно: сначала выбирается соответствующая страница, потом на ней указывается нужное место. Предусмотрена также возможность дописывания существующего MP3-файла. На случай длинных текстов возможна запись в фоновом режиме и автоматическое отключение ПК по ее окончании.

 

ToM Reader не богат функциями редактирования. Если описанные выше программы обладали хоть минимальными свойствами текстового редактора, то ToM Reader - скорее средство просмотра. Есть только средства поиска, выделения (только разворота целиком) и вставки текста из буфера обмена на "чистый лист".

 


Здесь нет такого понятия как положение курсора - как, собственно, нет и самого курсора. Есть только указатель, отмечающий строчку, которую читает программа. Его можно перемещать, чтобы отметить точку начала чтения. Однако, в отличие от Мыши и Говорилки, ToM Reader может начать читать не с любой точки текста, а только с начала строки. Кроме того, этот указатель, хоть и перемещается вниз по мере чтения, но, дойдя до конца разворота, останавливается, несмотря на то что программа продолжает читать. Таким образом пользователь лишается возможности визуально следить за текстом.

 

Но главная изюминка программы - оптимизация для чтения электронных книг. Не просто документов, не почты, а именно книг. И не просто чтения, а чтения систематического.

 

Обычная закладка в ToM Reader сделана довольно небрежно. Во-первых, здесь она, в отличие от других программ, отмечает не точку в тексте, а разворот страниц, как в обычной, "бумажной" книге. С одной стороны, это явно нерациональное использование "врожденных" возможностей программы. Но, с другой стороны, ведь мы и сами не можем продолжить чтение с того слова или, тем более, с той буквы, на которой прервали его в прошлый раз. Нам нужно восстановить хотя бы пару предыдущих фраз. Зато ToM Reader, открывая документ, анализирует его, распознает названия глав и составляет оглавление, которое служит мощной поддержкой хлипкой закладке.

 


Две другие функции с лихвой компенсируют то обстоятельство, что ToM Reader является однодокументным приложением и не позволяет открыть несколько книг сразу. Это книжный каталог и менеджер архивов. Книжный каталог позволяет создать на базе ToM Reader картотеку, в которой удобно хранить данные о книгах и откуда эти книги удобно открываются для чтения.

 

Поскольку большие книги часто хранятся в упакованном виде, в состав ToM Reader включен менеджер архивов. Он представляет собой окно, разделенное на три части: в верхней представлен список ZIP-файлов, содержащихся в выбранном каталоге, в средней - содержимое выбранного архива и в нижней - комментарий к этому архиву. К сожалению, программа "понимает" только формат ZIP, но не RAR.

 

Таким образом, ToM Reader - это программа, сочетающая в себе функции речевого синтезатора, "читалки" с экрана и каталога электронных книг. Она должна очень понравиться любителям электронной литературы и завсегдатаям библиотеки Мошкова.

 

Послесловие

 

Итак, мы пошли другим путем. Помимо нескольких покупных дисков серии "Библиотека в кармане", у нас собралась солидная подборка книг из интернета - главным образом от Мошкова. Мы часто и с удовольствием проводим час-другой вечера за электронным чтением. Но наши друзья по-прежнему не разделяют этого увлечения. Заслышав бормотание "Говорящей мыши", они начинают вежливо-вежливо улыбаться, часто кивать, меняют тему разговора и ни за что не соглашаются послушать книгу вместе, предлагая лучше посмотреть видик. И не то чтобы они не любили читать - напротив, они тоже очень уважают книгу, в том числе и электронную. Но предпочитают носить очки или покупать дорогие мониторы.

 

И, между нами говоря, я их понимаю.

 

Речевые синтезаторы

 

Разработчик

Lernout&Hauspie

Digalo

Условия приобретения

бесплатно

условно бесплатно

Объем архива

3 Мб

7,8 Мб

Домашняя страница

http://www.lhsl.com/

http://www.digalo.com/

Адрес архива

http://activex.microsoft.com/activex/controls/agent2/lhttsrur.exe

http://www.digalo.com/download/DigaloCoreRus.exe

 

 

 

 

 

 

 

 

 

   
 

В отличие от "говорящей мыши", другие программы, описанные в статье, построены по одному и тому же принципу: для синтеза речи используются "речевые движки" (speech engine) внешних разработчиков, так что автор программы может вплотную заняться интерфейсом. Большинство "движков" платные и, кроме того, рассчитаны на английский язык. Из русских бесплатных синтезаторов доступны только два семейства - мужской и женский голоса производства компании Lernout&Hauspie и французской фирмы Digalo.

 

Первая предоставляет два русскоговорящих "голоса" - мужской и женский, а вторая - только мужской, названный Nikolai. Здесь следует отметить одну особенность: если голоса LH по-прежнему воспринимаются как машинные (мужской вообще напоминает голоса агентов Торговой Федерации из первого эпизода "Звездных войн"), то Николай Дигало - вполне человек. У него легкий, почти незаметный иностранный акцент, что более чем простительно для француза. А еще, судя по печальному выражению, с которым Николай читает текст, он - явно выраженный меланхолик.

 

Теперь обратимся к языковым особенностями, которые вызывали затруднения у предыдущих программ, и проверим их на этих двух синтезаторах.

 

Lernout&Hauspie

 

Сокращения вроде "г. Киев" и "г-н Петров" голоса Lernout&Hauspie, в отличие от Мыши, читают правильно. С римскими цифрами дело тоже обстоит гораздо лучше. Они читаются как порядковые числительные мужского рода. Благодаря этому сочетания вроде "XX век" интерпретируются совершенно правильно, а "глава VI" - грамматически неправильно, но понятно. Некоторые оставшиеся шероховатости следует отнести к числу недоработок программы: I читается как "ай", II - "second", V - "ви", X - "экс", XIX - "nineteenth", а XXI - "двадцатый первый".

 

Что же касается ударений, то здесь прогресс еще заметнее: синтезатор ошибается гораздо реже. Из ошибок можно отметить "белый батон" и… нет, уже не ту самую фразу из "Аэлиты", а контрольный "анализ мочи". LH впадает в противоположную крайность: в обоих случаях ставит ударение на первый слог. Впрочем, вряд ли стоит требовать от программы правильной расстановки ударений там, где люди ориентируются по смыслу предложения.

 

Digalo

 

По части "человеческих" интонаций этот модуль вне конкуренции. "Контрольная" фраза "Помираю, Мстислав Сергеевич…" в исполнении печального Николая Дигало способна выдавить слезу - так трагически он раскатывает "р" и тянет: "помирра-а-аю…" А слово "нет" он произносит так длинно и печально, как будто за этим "нет" стоит роковая ошибка его юности, из-за которой он не стал великим трагиком и теперь перебивается в должности речевого синтезатора.

 

"Обратной стороной" этой медали является чисто человеческая манера Николая "глотать" окончания слов: иногда громкость в конце слов понижается настолько, что становится совсем не слышно.

 

Зато Николай пытается - и небезуспешно - склонять числительные. Не то чтобы он всегда попадал в род и падеж, но частенько у него это получается. К сожалению, по части римских цифр он сильно уступает паре L&H: нормально произносит только двойку - остальные цифры звучат дикой смесью русских и латинских букв.

 

Однако в целом Николай производит приятное впечатление. Особенно хорошо его мягкий интеллигентный голос, на мой взгляд, подходит для чтения русской классики. Учитывая французское происхождение программы, становится интересно: не стал ли прототипом мсье Дигало один из "белых" эмигрантов?

2004.05.05
19.03.2009
В IV квартале 2008 г. украинский рынок серверов по сравнению с аналогичным периодом прошлого года сократился в денежном выражении на 34% – до $30 млн (в ценах для конечных пользователей), а за весь календарный год – более чем на 5%, до 132 млн долл.


12.03.2009
4 марта в Киеве компания Telco провела конференцию "Инновационные телекоммуникации", посвященную новым эффективным телекоммуникационным технологиям для решения задач современного бизнеса.


05.03.2009
25 февраля в Киеве компания IBM, при информационной поддержке "1С" и Canonical, провела конференцию "Как сохранить деньги в условиях кризиса?"


26.02.2009
18-19 февраля в Киеве прошел юбилейный съезд ИТ-директоров Украины. Участниками данного мероприятия стали ИТ-директора, ИТ-менеджеры, поставщики ИТ-решений из Киева, Николаева, Днепропетровска, Чернигова и других городов Украины...


19.02.2009
10 февраля в Киеве состоялась пресс-конференция, посвященная итогам деятельности компании "DiaWest – Комп’ютерний світ" в 2008 году.


12.02.2009
С 5 февраля 2009 г. в Киеве начали работу учебные курсы по использованию услуг "электронного предприятия/ учреждения" на базе сети информационно-маркетинговых центров (ИМЦ).


04.02.2009
29 января 2009 года в редакции еженедельника "Computer World/Украина" состоялось награждение победителей акции "Оформи подписку – получи приз!".


29.01.2009
22 января в Киеве компания "МУК" и представительство компании Cisco в Украине провели семинар для партнеров "Обзор продуктов и решений Cisco Small Business"

 

 
 
Copyright © 1997-2008 ИД "Комиздат".