Клавиатурный тренажер VerseQ - новый шаг в технологиях обучения слепой десятипальцевой печати. Уже сегодня, через час вы сможете печатать вслепую. Проверьте сами!
VerseQ - клавиатурный тренажер нового поколения, уже через час вы сможете печатать вслепую!
Пользовательские генераторы буквенных последовательностей

 
Начать новую тему   Ответить на тему    Список разделов форума » Вопросы по клавиатурному тренажеру VerseQ и слепой десятипальцевой печати
Предыдущая тема :: Следующая тема  
Автор Сообщение
aneganov



Зарегистрирован: 24.03.2006
Сообщения: 43


СообщениеДобавлено: Вс Апр 02, 2006 2:03 pm    Заголовок сообщения: Пользовательские генераторы буквенных последовательностей Ответить с цитатой

В продолжение темы.

Есть предложение расширить VerseQ, обеспечив пользователей возможностью создавать собственные генераторы буквенных последовательностей. Т.е. помимо статистически сформированных умных баз данных, хотелось бы иметь и тупые (dumb), но настраиваемые, чтобы существенно сократить время изучения определенных сочетаний. Самый простой способ (на основе имеющегося движка) - это сгенерировать входной текст и передать его программе, которая делает словари. В итоге она сделает ту самую тупую БД. Однако было бы на порядок удобнее, если бы строки задавались граматикой или просто регекспом.

Например, учим смешанный регистр: ([a-zA-Z]{1,8}| )
+ цифры: ([a-zA-Z]{1,8}|[\d]?| )
+ знаки (пишу без экранирования): ([a-zA-Z]{1,8}|[\d]?|[,.:'"/><!@#$%^&*()_+]?)

Все альтернативы можно считать вероятными.

Хм?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
aneganov



Зарегистрирован: 24.03.2006
Сообщения: 43


СообщениеДобавлено: Вс Апр 02, 2006 2:13 pm    Заголовок сообщения: Ответить с цитатой

Уточню: очевидно, при таком подходе (с генераторами) не смогут работать интеллектуальные алгоритмы формирования желтых строк.

Так что снова всё тот же вопрос: Владимир, когда Вы дадите нам собиралку баз данных? Она же у Вас есть, дайте её в любом виде, пусть это будет сырая альфа, никто не обидется.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Вс Апр 02, 2006 2:35 pm    Заголовок сообщения: Ответить с цитатой

Уже есть с Windows интерфейсом... Только ее еще нужно добработать, во всяком случае возможность задавать автора базы, а то она пока все делает от моего имени Smile

По поводу регэкспов - пока я их не встроил в интерфейс, по этому пока придется делать предобработку регэкспами вручую. Т.е. как предобработку. Использовать как фильтр уже готовым базам - чревато, т.к. будут разрывы семантических последовательностей.

С уважением, Владимир
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
aneganov



Зарегистрирован: 24.03.2006
Сообщения: 43


СообщениеДобавлено: Вс Апр 02, 2006 3:40 pm    Заголовок сообщения: Ответить с цитатой

Да, пожалуй, регекспы уж слишком тупо Smile Но над идеей генерации 10-мегабайтных входных текстов можно поработать. Например, взять несколько обычных текстов (тех, что использовались для создания умных БД) и разбавить их нужными последовательностями с тем, чтобы в БД они появлялись чаще или применить какое-либо другое преобразования к тексту. А семанитические последовательности можно и не разрывать, это на усмотрение фильтра.


То, что прога под Windows - не вопрос, для создания БД можно пересесть и за виндовую машину Smile
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Вс Апр 02, 2006 4:56 pm    Заголовок сообщения: Ответить с цитатой

Цитата:
А семанитические последовательности можно и не разрывать, это на усмотрение фильтра.

Так ведь любой фильтр будет разбивать фонетическую связность последовательностей. Ибо фильтр по своей сути не умеет делать сшивку по краям. Smile

С уважением, Владимир
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
aneganov



Зарегистрирован: 24.03.2006
Сообщения: 43


СообщениеДобавлено: Вс Апр 02, 2006 5:06 pm    Заголовок сообщения: Ответить с цитатой

Ну и что? Слова можно не рубить, оставляя статистику русского языка, а уж без статистики последовательности слов и знаков можно и прожить ради цели: научиться набирать что-то.

Взять Ваш Advanced. Там заглавные буквы попадаются 2-3 на строку в лучшем случае. Т.е. чтобы мне хотя бы по разу увидеть ВСЕ заглавные нужно как минимум 15 строк. Я уже не говорю о том, что чтобы научиться их набирать как строчные, нужно потратить уйму времени.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Вс Апр 02, 2006 5:15 pm    Заголовок сообщения: Ответить с цитатой

Цитата:
Я уже не говорю о том, что чтобы научиться их набирать как строчные, нужно потратить уйму времени.

Вот тут как раз и срабатывает статистические механизмы и психологические парадоксы. Ведь буквы Ы вы еще реже встречаете, чем заглавные буквы, однако, то что она появляется редко - кажется вполне закономерным.

В общем тут все просто - буква чаще/реже в языке - значит и отработка чаще/реже - значит и нажимать чаще/реже - значит и интегральное затраченное время на написание текста будет минимально при одном и том-же затраченном времени на обучение, т.к. самые частые буквы Вы будете отрабатывать быстро, а редкие Вам просто придется редко нажимать - классика оптимизация Smile Примерно тоже самое используется в базах данных для оптимизации времени выборки, да даже кэширование имеет одну с этим подходом природу. Smile

Психологический парадокс здесь в том, что мы внутренне не готовы к тому, что Заглавное написание букв не такое уж и частое и по сути не такое уж и важное, как внутренне кажется, а чистой статистике - ей все равно - у нее нет авторитетов - только честные цифры. Smile

С уважением, Владимир
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Вс Апр 02, 2006 5:19 pm    Заголовок сообщения: Ответить с цитатой

Хотя с буквой Ы я наврал, возьмем лучше букву Ъ Smile
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
aneganov



Зарегистрирован: 24.03.2006
Сообщения: 43


СообщениеДобавлено: Вс Апр 02, 2006 5:40 pm    Заголовок сообщения: Ответить с цитатой

Владимир, я не спорю о правильности выбора дефолтовых словарей в версии 3.0.9. Но посмотрите на ситуацию с другой стороны. Я, например, никогда раньше не пользовался правым шифтом и чтобы научиться это делать быстро нужно нечто большее, чем просто статистика русского/анлгийского языка. Да, чего уж там, вот такая вот строка - она что, сильно отражают семантику языка? Smile Я просто хочу такую же, но с пробелами и смесью регистров; по отсутсвию семантики она, возможно, будет конкурировать с оригиналом.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Вс Апр 02, 2006 11:46 pm    Заголовок сообщения: Ответить с цитатой

С шифтом я уже придумал изящный способ... Smile Нужно только реализовать... Smile

С уважением, Владимир
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
aneganov



Зарегистрирован: 24.03.2006
Сообщения: 43


СообщениеДобавлено: Пн Апр 03, 2006 1:17 am    Заголовок сообщения: Ответить с цитатой

Угу, значит через пару лет выйдет шифтованная версия...
Ну что же, подождем...

Bird
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Пн Апр 03, 2006 1:38 am    Заголовок сообщения: Ответить с цитатой

Намек с укором понял... Постараюсь работать побыстрее... Smile

С уважением, Владимир
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
aneganov



Зарегистрирован: 24.03.2006
Сообщения: 43


СообщениеДобавлено: Пн Апр 03, 2006 1:42 am    Заголовок сообщения: Ответить с цитатой

Smile

Владимир, а давайте я попробую собрать пару исходников (с языками программирования, спец. символами и тд), загзиплю и пришлю Вам, а Вы сделаете словарь. Это можно?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
ThermIt



Зарегистрирован: 01.02.2006
Сообщения: 147


СообщениеДобавлено: Пн Апр 03, 2006 11:23 am    Заголовок сообщения: Ответить с цитатой

Vladimir Kim писал(а):
Хотя с буквой Ы я наврал, возьмем лучше букву Ъ Smile
К слову о букве Ы... Как-то моей сестре задали в школе зашифровать какой-нибудь текст самым простым методом - заменой букв на значки или другие буквы. Расшифровывается он просто - по частоте символов. Когда пришла пора сдавать результаты её текст казался самым простым, на листочке было несколько строчек, нарисованных не обычными рожицами, чёртиками и цветочками, а простыми печатными русскими буквами... в результате её вызвали к доске. Даже посчитав количество букв учитель не заметил ничего странного, однако странности стали появляться когда он начал спрашивать - это буква О? - нет - может Е? - нет, это Ы... Angel Very Happy дальше были У, Ъ, Ь, Б и т.п. причём половина символов встречалась с равной частотой. Very Happy Так что в жизни бывает всякое.
ps: ждём генератор баз.
pps: Repa
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Ср Апр 12, 2006 11:18 am    Заголовок сообщения: Ответить с цитатой

Цитата:
Владимир, а давайте я попробую собрать пару исходников (с языками программирования, спец. символами и тд), загзиплю и пришлю Вам, а Вы сделаете словарь. Это можно?

Можно, но боюсь я тогда вообще программу для генерации баз никогда не допишу... Smile

Цитата:
К слову о букве Ы... Как-то моей сестре задали в школе зашифровать какой-нибудь текст самым простым методом - заменой букв на значки или другие буквы.

Ужастно примитивный шифр... Smile Взламывать такой шифр частотной встречаемостью удобно при больших объемах текста, а при малых объемах, когда частотность плохо выражена, гораздо проще использовать биграмный анализ. Smile

Вот, кстати - http://www.verseq.ru/forum/topic239.htm
Оказывается Ы не такая уж и редкая буква... Smile

С уважением, Владимир.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
aneganov



Зарегистрирован: 24.03.2006
Сообщения: 43


СообщениеДобавлено: Чт Апр 13, 2006 2:00 am    Заголовок сообщения: Ответить с цитатой

Vladimir Kim писал(а):
Цитата:
Владимир, а давайте я попробую собрать пару исходников (с языками программирования, спец. символами и тд), загзиплю и пришлю Вам, а Вы сделаете словарь. Это можно?

Можно, но боюсь я тогда вообще программу для генерации баз никогда не допишу... Smile


Значит ли это, что разработка генератора находится в зачаточном состоянии? Sad
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Чт Апр 13, 2006 2:08 am    Заголовок сообщения: Ответить с цитатой

Цитата:
Значит ли это, что разработка генератора находится в зачаточном состоянии?

Да нет, в том то все и дело что последней стадии - все самое интересное (ядро, анализ, построение) уже написаны - осталась скучная рутина - интерфейс... Smile

С уважением, Владимир
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
aneganov



Зарегистрирован: 24.03.2006
Сообщения: 43


СообщениеДобавлено: Чт Апр 13, 2006 3:51 am    Заголовок сообщения: Ответить с цитатой

А он точно нужен этот интерфейс? Ведь генерация базы это далеко не ежедневное занятие рядового пользователя.

Не знаю какую функциональность Вы хотите вложить в данную тулзу, но неужели выразительные возможности командной строки недостаточны?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Пн Май 01, 2006 2:07 pm    Заголовок сообщения: Ответить с цитатой

Командная строка - это только для гуру... Smile
Да и то в этом случае придется делать файлы-профили, в которых указывать и кодировку и алфавит и глубину и авторов... Т.ч. с интерфейсом даже проще будет. Smile

С уважением, Владимир
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
ThermIt



Зарегистрирован: 01.02.2006
Сообщения: 147


СообщениеДобавлено: Чт Май 04, 2006 8:19 am    Заголовок сообщения: Ответить с цитатой

Что вы там так долго делаете? Окошко, десяток галочек, пара такстбоксов и кнопка "ok", вот всё что нам нужно. Smile
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
ThermIt



Зарегистрирован: 01.02.2006
Сообщения: 147


СообщениеДобавлено: Чт Май 04, 2006 8:25 am    Заголовок сообщения: Ответить с цитатой

Vladimir Kim писал(а):
...гораздо проще использовать биграмный анализ. Smile

Только не стоя у доски Smile

Vladimir Kim писал(а):

Вот, кстати - http://www.verseq.ru/forum/topic239.htm
Оказывается Ы не такая уж и редкая буква... Smile

Ага, но мы нарачно её туда напихали во всех допустимых случаях... Embarassed
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Vladimir Kim
Команда VerseQ


Зарегистрирован: 21.03.2004
Сообщения: 2173
Откуда: Москва

СообщениеДобавлено: Вт Май 16, 2006 12:41 pm    Заголовок сообщения: Ответить с цитатой

Цитата:
Ага, но мы нарачно её туда напихали во всех допустимых случаях...

Такая штука может спутать частотный анализ, а биграмный уже врядли. Smile

С уважением, Владимир
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
Показать сообщения:   
Начать новую тему   Ответить на тему    Список разделов форума » Вопросы по клавиатурному тренажеру VerseQ и слепой десятипальцевой печати Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group
Copyright © 2005 Vladimir Kim. All rights reserved.
Графический дизайн - Марина Ким.