| Предыдущая тема :: Следующая тема |
| Автор |
Сообщение |
smn#8 Гость
|
Добавлено: Чт Дек 02, 2004 9:07 pm Заголовок сообщения: Внутрь |
|
|
Здраствуйте, Владимир!
Я давно знаю вашу программу (года с 2001 наверное). К сожалению я человек крайне нетерпеливый и, видимо, это единственное объяснение тому, что я так и не стал ее использовать по прямому назначению.... Когда я впервые прочитал фразу "симбиоз клавиатурного тренажера и высшей математики", я еще ничего не знал о цепях Маркова. Недавно я вспомнил про вашу разработку и заинтересовался тем, как же все-таки она устроена. На форуме по этому поводу ничего не нашлось. Конечно, ваша семантическая модель, алгоритмы генерации строк и базы -- это то из чего должен получиться коммерческий продукт, но было бы любопытно узнать хоть какие-то детали. Что такое база? Это просто большая матрица переходов + начальное распределение? Переходы осуществляются между аккордами? |
|
| Вернуться к началу |
|
 |
Vladimir Kim Команда VerseQ

Зарегистрирован: 21.03.2004 Сообщения: 2173 Откуда: Москва
|
Добавлено: Чт Дек 02, 2004 10:35 pm Заголовок сообщения: |
|
|
Добрый вечер smn#8!
На самом деле все просто. Любая система, влючая язык имеет некоторый набор состояний. Из состояния в состояние, система всегда переходит не случайно, а сообразуясь со своими внутренними законами.
Так, например, будучи в одном состоянии, система может никогда не пререти в во второе, но может перейти в третье. Однако, даже не зная внутренних механизмов, такие системы можно попробывать описать вероятностно с помощью инструмента цепей Маркова. Где для каждого состояния системы вводится вероятность перехода в одно или другое состояние.
При этом понятно, что в разных состояниях будут разные вероятности прехода. В случае языка, в качестве текущего состояния мы можем взять одну букву. Например после Ь система никогда не перейдет опять в состояние с Ь знаком, а вот в стостояние Н вполне возможно... и т.д. Если проанализировать тексты, то можно расчитать все переходы из состояния в состоние и таким образом построить семантическую модель языка.
Используя эту модель, можно сделать многое, например что либо моделировать или предсказывать поведение. В случае VerseQ модель используется для генерации фонетически связных строк.
Ну, очень надеюсь, что хоть и сбивчиво, но немного объяснил
общие положения.
С уважением, Владимир |
|
| Вернуться к началу |
|
 |
Гость
|
Добавлено: Пт Дек 03, 2004 10:49 am Заголовок сообщения: |
|
|
Спасибо за ответ. Я все понял Цепь в пространстве букв -- действительно просто.
Кстати еще один вопрос. Пришлось модель адаптировать под язык или даже под конкретный язык? В смысле насколько быстрых результатов можно ожидать от самой общей модели, если ее попытаться применить еще где-нибудь? Или все-таки следует помучаться с выбором пространства, и т.д.? |
|
| Вернуться к началу |
|
 |
Пират Гость
|
Добавлено: Пт Дек 03, 2004 8:28 pm Заголовок сообщения: |
|
|
Владимир, а Вы не боитесь, что какой-нибудь другой программист или группа программистов могут "позаимствовать" Вашу идею генерации строк по базе языка и статистике ошибок, создать аналогичный коммерческий продукт, имея мощные ресурсы как следует раскрутить его и настричь бабла, извиняюсь за выражение ?
Не думаю, что для этого потребуется в первых версиях корпеть над изощренным математическим алгоритмом, главное раскрутка, а потом можно привлечь на помощь высокооплачиваемых специалистов из области математики и психологии.
Зарегистрирована ли как-либо Ваша идея? |
|
| Вернуться к началу |
|
 |
smn#8 Гость
|
Добавлено: Пт Дек 03, 2004 9:33 pm Заголовок сообщения: |
|
|
Еще один вопрос. Владимир, как вы думаете, можно ли получить какие-нибудь интересные результаты в области иммитации музыки?
И еще: понятно, что модели с зависимостью только от последнего состояния проще, но можно ли попытаться добиться нового качества в случае анализа зависимости от n предыдущих состояний? |
|
| Вернуться к началу |
|
 |
Vladimir Kim Команда VerseQ

Зарегистрирован: 21.03.2004 Сообщения: 2173 Откуда: Москва
|
Добавлено: Пн Дек 06, 2004 11:09 am Заголовок сообщения: |
|
|
Всем привет!
Прошу прощения, что так долго не отвечал - перестанавливал себе систему - переезжал на новый жесткий диск
| Цитата: |
Кстати еще один вопрос. Пришлось модель адаптировать под язык или даже под конкретный язык? В смысле насколько быстрых результатов можно ожидать от самой общей модели, если ее попытаться применить еще где-нибудь? Или все-таки следует помучаться с выбором пространства, и т.д.?
|
Конечно, чистое ничего не работает. Одно только форматирование в тексте вносит искажения в модель, которые необходимо компенсировать.
| Цитата: |
Владимир, а Вы не боитесь, что какой-нибудь другой программист или группа программистов могут "позаимствовать" Вашу идею генерации строк по базе языка и статистике ошибок, создать аналогичный коммерческий продукт, имея мощные ресурсы как следует раскрутить его и настричь бабла, извиняюсь за выражение ?
|
Ну тогда придется переквалифицироваться в инженеры-дворники
| Цитата: |
Не думаю, что для этого потребуется в первых версиях корпеть над изощренным математическим алгоритмом, главное раскрутка, а потом можно привлечь на помощь высокооплачиваемых специалистов из области математики и психологии.
Зарегистрирована ли как-либо Ваша идея?
|
Нет, есть только право первопроходца в этой конкретной задаче
Правда в любом случае я не стороник сокрытия секретов, кроме конкретной реализации. Наверное, это отпечаток академии и принципов научной этики
| Цитата: |
Еще один вопрос. Владимир, как вы думаете, можно ли получить какие-нибудь интересные результаты в области иммитации музыки?
|
Я думал над этим - это тоже можно будет попробывать сделать - единственно, чего мне не хватает - это музыкального образования
| Цитата: |
И еще: понятно, что модели с зависимостью только от последнего состояния проще, но можно ли попытаться добиться нового качества в случае анализа зависимости от n предыдущих состояний?
|
А это и так сейчас уже и реализовано и результат можете видеть своими глазами. Более того, это было сделано еще в KeyTO Сейчас в KeyTO и VerseQ глубина 4, а в KeyTOSE - 3.
На самом деле повышение глубины способствует улучшению качества только до некоторой величины. Так оказалось, что размерность 3-5 это наиболее оптимальная, во всяком случае для русского языка. Если разрядность увеличивать дальше - строки теряют инвариантность и часто сваливаются в локальные области аттракторов.
С уважением, Владимир |
|
| Вернуться к началу |
|
 |
smn#8 Гость
|
Добавлено: Пт Дек 10, 2004 1:35 pm Заголовок сообщения: |
|
|
Я тут подумал о составлении модели для процесса без знания его специфики. То есть для языка просторанством состояний становятся буквы. Ну и, соответственно, начинают учитываться условные вероятности при n предыдущих буквах. Возникает вопрос: а что если взять в качестве состояний биты теста? Тогда влияние переходов, не соответствующих целым байтам будет принебрежимо мало? Я спрашиваю именно про текст, так как вы работали именно с текстом. Хотя думаю про музыку и мысли у меня такие появляются тоже из-за отсутствия музыкального образования..... Плохо я представляю как в wav-файле можно выделить состояния... Разве что по разрядности дискретизации... Если бы состояния "сами" выделялись при оценке переходов...  |
|
| Вернуться к началу |
|
 |
Vladimir Kim Команда VerseQ

Зарегистрирован: 21.03.2004 Сообщения: 2173 Откуда: Москва
|
Добавлено: Вс Дек 12, 2004 2:26 am Заголовок сообщения: |
|
|
Здравствуйте smn#8!
Безусловно важно всетки знать специфику изучаемого процесса. И выбирать в качестве базиса основные состояния именно для процесса. Биты букв - это уже состояния подсистем, из которых состоит общая система. В этом случае связность переходов между подсистемами будет пренебрежительно мала и неадекватна процессу.
| Цитата: |
Хотя думаю про музыку и мысли у меня такие появляются тоже из-за отсутствия музыкального образования..... Плохо я представляю как в wav-файле можно выделить состояния...
|
В музыке все гораздо сложнее - музыка в отличии от письма - это многопотокавая информация. WAV - файл это уже результат сложения работы различных процессов, пиано, тромбона, гитары, вокала и т.д. И действительно, выделить состояния сдесь крайне сложно, хотя конечно тоже можно. Главное подобрать удобное параметрическое пространство.
С уважением, Владимир |
|
| Вернуться к началу |
|
 |
Palaver Гость
|
Добавлено: Вс Авг 21, 2005 2:01 am Заголовок сообщения: |
|
|
| Уважаемый хозяин этого сайта! Если вы его ещё посещаете, то не моглибы вы поделится матерьялами на тему цепей Маркова, относительно генерации текста. Просто уже весь нет перерыл, а ничего ценно пока не нашёл. Мыло для связи palaver[собака туту]narod.ru |
|
| Вернуться к началу |
|
 |
Vladimir Kim Команда VerseQ

Зарегистрирован: 21.03.2004 Сообщения: 2173 Откуда: Москва
|
Добавлено: Вс Авг 21, 2005 10:47 am Заголовок сообщения: |
|
|
Добрый день Palaver!
| Цитата: |
Если вы его ещё посещае
|
Ну фактически каждый день
| Цитата: |
не моглибы вы поделится матерьялами на тему цепей Маркова, относительно генерации текста.
|
Насчет генерации текста не уверен. Это такая своеобразная игрушка из цепей Маркова. А сами цепи Маркова можно найти в любом учебнике или справочнике по статистике не ниже вузовского. Также, еще иногда встречается в книжках по криптографии. |
|
| Вернуться к началу |
|
 |
|
|
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах
|
Powered by phpBB © 2001, 2005 phpBB Group
|