Не важно, кто вы - студент или домохозяйка, следователь уголовного розыска или просто человек рассеянный с улицы Бассейной. Не важно, для чего вам понадобилось записать звук с линейного входа звуковой карты. Для переноса коллекции виниловых пластинок на современный носитель или для использования персонального компьютера в качестве о-о-очень вместительного магнитофона. Автору статьи, например, это было нужно в сугубо профессиональных целях - для работы с диктофоном.


У любого мыслящего человека периодически возникает необходимость как-то фиксировать поток этих самых мыслей. Бизнесмены и врачи, журналисты и офис-менеджеры - многие специалисты используют в своей профессиональной деятельности диктофоны.


И, как всегда, приходится выбирать между ценой и удобством. Цифровые диктофоны компактны, легки и удобны. Но дороги. Кассетные диктофоны раза в три дешевле, но их не очень удобно использовать. Ведь запись лекции или интервью, надиктовка проекта договора или текущего состояния пациента - это лишь полдела. Этот материал необходимо еще преобразовать в удобный для использования вид.


Перевод записи разговора на бумагу, в текстовый вид, по аналогии со стенографией называют расшифровкой. И все, кому хоть раз в жизни приходилось этим заниматься, знают, насколько эта работа монотонна и утомительна. Включил воспроизведение, послушал фрагмент, нажал паузу, набрал текст, включил воспроизведение… А если еще используется мононаушник…


Для упрощения этой процедуры даже выпускаются специальные магнитофоны - транскрайберы - с хорошим динамиком и удобным пультом дистанционного управления. Но стоит такое устройство намного дороже собственно диктофона.


То ли дело цифровой диктофон: подключил к персональному компьютеру, переписал на него звуковой файл и делай с ним что угодно. И расшифровывать записи удобно, и архивировать. А в перспективе - глядишь, и вовсе можно будет переложить расшифровку фонограмм на программы распознавания речи.


Вот и рассмотрим, как заставить работать в тандеме обычный кассетный диктофон и компьютер. В итоге получим некий гибрид аналогового и цифрового диктофонов. Точнее, с помощью компьютера дополним возможности одного вида функциями другого.


Подключаем


Как ни странно, но оказалось, что шнур для подключения диктофона к звуковой карте проще изготовить самостоятельно.  Обычно диктофоны не оснащаются гнездом выхода, и подключиться можно только через гнездо наушников. В моем случае для этого нужен был шнур для соединения монофонического гнезда диаметром 2,5 мм на диктофоне со стереофоническим - диаметром 3,5 мм - на звуковой плате.

 

  


Принадлежность, что и сказать, специфическая.  Во всяком случае, мне не удалось найти такого проводочка в продаже. А если к этому добавить, что за простейший переходник 2,5 мм моно на 3,5 мм стерео в магазине просят около 30 гривен… В общем, на радиорынке пара метров подходящего провода и соответствующие вилки обошлись мне в трешку. (Между прочим, в одном из американских интернет-магазинов подобный соединитель продают за $25.)

 


 Думаем


В первую очередь нам необходимо определиться с тем, каким битрейтом (bitrate) кодировать. Поскольку MPEG - это алгоритм сжатия с потерей качества, надо подобрать вариант с наилучшим сочетанием качество/коэффициент сжатия.


В телефонии есть такое понятие, как "разборчивость речи". По сути, речь идет о достаточном минимуме. О минимуме качества и, соответственно, аппаратных средств, необходимых для того, чтобы можно было разобрать сказанное. Так вот, считается, что для получения звучания, аналогичного телефонной линии, речь достаточно кодировать с качеством 8 Кбит/с. При этом частотный диапазон ограничен 2,5 кГц - вполне приемлемо для записи голоса. Зато коэффициент сжатия составляет 96:1, и минута звучания займет на жестком диске всего 60Кб! Лично я записывал именно таким образом.


Можно, конечно, задать и более высокое качество. Например, некоторые цифровые диктофоны в режиме сверхвысокого качества записи кодируют звук на уровне 32 Кбит/с. В принципе, для речевых программ это разумный максимум - дальше повышать битрейт нецелесообразно. При таком кодировании уменьшаются характерные для низких битрейтов квакающие искажения, а тембр голоса приобретает более естественную окраску, но и размер файла увеличивается, соответственно, в 4 раза.


Функция VBR (переменный битрейт) на низких битрейтах малоэффективна, поэтому использовать ее не рекомендуется.


Собственно, качество звучания каждый волен выбирать сам - в зависимости от личных предпочтений и возможностей техники. Можно записать два варианта: с низким битрейтом для архива и более высоким непосредственно для расшифровки. Но в любом случае стоит учитывать, что при повышении качества кодирования лучше слышен не только голос говорящего, но и фоновые шумы.


Существуют всевозможные программные фильтры - как в виде дополнительных модулей, так и в виде отдельных программ. Но для их работы потребуются дополнительные вычислительные мощности. Кроме того, качественная очистка звука от шумов обычно требует тонкой ручной настройки. В случае обычной диктофонной записи такие трудозатраты едва ли оправданы (если, конечно, вы не майор Мельниченко J).


Записываем


Программ для записи звука существует великое множество. Тот же Фонограф из комплекта Windows… Но я (после длительных поисков и экспериментов) решил остановится на программке MixMp3 Дмитрия Лесникова.


Программа бесплатная и очень маленькая (72Кб). По сути, это небольшая "надстойка" над популярным кодером Lame. Она позволяет записывать на жесткий диск информацию непосредственно со звуковой карты в формате mp3 в реальном времени (что называется, "кодировать на лету"). При этом аппаратные требования у нее довольно скромные: процессор класса Pentium-200 и 24 Мб оперативной памяти.


Собственно, кодер Lame в виде библиотеки располагается в той же директории, что и файл mixmp3.exe. Имя файла - mp3enc.dll. С программой поставляется Lame версии 3.87, но его не сложно заменить на более свежую. Для этого достаточно новую версию файла lame_enc.dll переименовать в mp3enc.dll и заменить ею старую. По крайней мере, с версией 3.92 такая подмена отлично сработала.

 


 Программа MixMP3 выполнена в виде консольного приложения. Основные команды запуска:

  • b nnn - задание рабочего битрейта;
  • d nn - задание рабочей частоты дискретизации;
  • f nnn - размер буфера;
  • mX - задание режима записи;
  • t nn - завершение работы по прошествию заданного интервала времени.

Всем, кто будет использовать эту программку, советую хотя бы раз прочесть readme.txt - помимо подробного описания параметров командной строки там можно найти полезные разъяснения касательно особенностей программы и различных режимов работы.


Чтобы не держать постоянно в голове ключи запуска MixMP3, проще сохранить необходимый набор ключей в виде файла BAT (или набора таких файлов) и потом запускать программу с его помощью. Например, я создал файл b8d24mm.bat со следующей строкой:

 

mixmp3.exe -b 8 -d 24 -f 5120 -mm -t 90 voice.mp3.

 

Можно, конечно, воспользоваться какой-нибудь программой с графическим интерфейсом - вроде Audiograbber. Но, как правило, все они рассчитаны на оцифровку музыки и, соответственно, на стереозвук и высокие битрейты, так что низкий битрейт и прочие параметры все равно придется задавать вручную.

 

 

 Ускоряем процесс


Самым большим недостатком такой схемы работы с диктофоном является скорость перезаписи звука с диктофона на компьютер. Ведь, как ни крути, а для этого понадобится, как минимум, один раз проиграть кассету на диктофоне. А это (в зависимости от длительности звучания кассеты и режима записи) - от тридцати минут до четырех часов. Но и тут существуют способы ускорения и автоматизации работы.


Во-первых, перезапись можно запустить на тот период, когда компьютер не используется - в обеденный перерыв или ночью. Достаточно только приблизительно - "на глаз" - определить время звучания записи и указать его MixMP3 с помощью ключа -t. По истечении этого периода программа автоматически прекратит запись и выключится. (Некоторые программы по завершении работы могут выключить и компьютер.) А если диктофон к тому же оснащен автореверсом и автостопом, то его можно вообще спокойно оставлять и уходить.


Во-вторых, любой мало-мальски приличный диктофон имеет несколько скоростей записи. И если вы, например, делали запись на скорости 1,2 см/с, то при воспроизведении смело можно включать удвоенную скорость - 2,4 см/с.


В итоге мы получим удвоенную скорость перезаписи и… совершенно неудобоваримое, на первый взгляд, "бормотание лилипутов". Но это только на первый взгляд. Для плеера WinAMP существует сменный модуль PaceMaker, который позволяет увеличивать и уменьшать скорость проигрывания. С его помощью можно замедлить воспроизведение как раз вдвое и получить в итоге нормальный звук.


Между прочим, посредством того же модуля можно программно имитировать функцию Fast Play, реализованную во многих диктофонах. Суть ее в том, что фонограмма воспроизводится на 20% быстрее. При этом речь по-прежнему остается разборчивой, но процесс прослушивания ускоряется.


Ну и, в-третьих, не стоит забывать о "горячих клавишах": клавиатурные сокращения - эффективный и несложный способ ускорения работы. При работе с WinAMP могут пригодиться следующие: пауза ; воспроизведение ; установки .

 

В чем смысл описанной выше технологи? В экономии времени и денежных средств. Хороший цифровой диктофон на сегодняшний день стоит около 700 грн. В то время как аналогичный кассетный стоит, по меньшей мере, вдвое дешевле. Причем подключить к компьютеру описанным выше способом можно любой имеющийся в наличии (пусть даже самый древний) диктофон. Ну, а что касается компьютера… так все равно в наше время человеку, регулярно работающему с текстами, без персонального компьютера не обойтись. Так почему бы не использовать его возможности полнее?

2004.04.15
19.03.2009
В IV квартале 2008 г. украинский рынок серверов по сравнению с аналогичным периодом прошлого года сократился в денежном выражении на 34% – до $30 млн (в ценах для конечных пользователей), а за весь календарный год – более чем на 5%, до 132 млн долл.


12.03.2009
4 марта в Киеве компания Telco провела конференцию "Инновационные телекоммуникации", посвященную новым эффективным телекоммуникационным технологиям для решения задач современного бизнеса.


05.03.2009
25 февраля в Киеве компания IBM, при информационной поддержке "1С" и Canonical, провела конференцию "Как сохранить деньги в условиях кризиса?"


26.02.2009
18-19 февраля в Киеве прошел юбилейный съезд ИТ-директоров Украины. Участниками данного мероприятия стали ИТ-директора, ИТ-менеджеры, поставщики ИТ-решений из Киева, Николаева, Днепропетровска, Чернигова и других городов Украины...


19.02.2009
10 февраля в Киеве состоялась пресс-конференция, посвященная итогам деятельности компании "DiaWest – Комп’ютерний світ" в 2008 году.


12.02.2009
С 5 февраля 2009 г. в Киеве начали работу учебные курсы по использованию услуг "электронного предприятия/ учреждения" на базе сети информационно-маркетинговых центров (ИМЦ).


04.02.2009
29 января 2009 года в редакции еженедельника "Computer World/Украина" состоялось награждение победителей акции "Оформи подписку – получи приз!".


29.01.2009
22 января в Киеве компания "МУК" и представительство компании Cisco в Украине провели семинар для партнеров "Обзор продуктов и решений Cisco Small Business"

 

 
 
Copyright © 1997-2008 ИД "Комиздат".