Технология Искусственого Интеллекта
новая дискуссия
Дискуссия
501
Искусственый Интеллект прежде всего это поисковая система, появившаяся как результат решения проблемы поставленой NIST TREC QA. А имено, как найти ответ в форме одной фразы на вопрос, в 6++ миллионах текстов, так чтобы этот ответ был осмысленным/ по смыслу. То есть, чтобы ответ был и в контексте, и подтекстах вопроса.
В ходе решения проблемы NIST TREC QA мною была выработана система и метод ИИ-разбора текста (запатентовано, см. USPTO на имя "Ilya Geller"), которые замещают единственый существовавший ранее n-gram разбор. К примеру есть предложение
-- Иван и Марфа весело смеются, она любит это.
n-gram разбор получает 2-3 фразы (паттерна, если не по Русски) из предложения. Например:
- Иван и Марфа весело смеются
- она любит это.
ИИ-разбор получает следующий набор (уже осмысленых фраз):
- и Иван весело смеётся
- и Марфа весело смеётся
- она любит смеятся
- Марфа любит смеятся
- она любит это
- Марфа любит это
- это любимо ею
- это любимо Марфой
- смех любим ею
- смех любим Марфой. Этот разбор алгоритмизируется, почитайте учебник грамматики?
Итак, ИИ-разбор даёт намного больше (и осмысленых!) фраз при разборе предложения, нежели n-gram. Это и есть основа ИИ как поисковой системы.
Структуировав подобным образом тексты человека, есть возможность создать из них его индивидуальный профиль, и затем аннотировать поисковые уже его запросы используя фразы из профиля. Тогда 1-2 слово поискового запроса становится несколькимми сотнями и тысячами слов, и поиск информации становится исключительно точным.
O Искусственого Интеллекта индексации.
Вынужден ссылатся на Великого, а имено на Лейбница: "Идею, согласно которой в мире не существует абсолютно схожих монад или двух совершенно одинаковых вещей, Лейбниц сформулировал как принцип «всеобщего различия» и в то же время как тождество «неразличимых», выдвинув тем самым глубоко диалектическую идею."
Итак, проблема - которая стояла предо мной в NIST TREC QA - была в том как найти то что нужно, если оно описывается одинаково (например, одним и тем же словом или словами). Я решил эту проблему за счёт аннотирования слова или слов фразы, описывающих нечто, по его (или их) словарными определениями. В деталях технолгия описана в моём патенте (см. USPTO на имя "Ilya Geller").
То есть имея расширеный до многих сотен и тысяч фраз поисковый запрос, ИИ сравнивает его с полноцеными текстами, описывающими нечто как наборы словарных определений, каждое из которых есть параграфы (структуированые через ИИ-разбор).
Кроме того ИИ-разбор вычленяет из текстов фразы, как правило состоящиии из 2-5 слов. И тогда сочетания 2-5 наборов словарных определений делает эти фразы совершено уникальными. К примеру, ища информацию в миллиардах текстах вы получите как результат, рискну сказать, 10-20 ответов. (В то время как Гугл вываливает на вас десятки миллионов ответов которые вы сортирует вручную, перебирая сочетания слов (для запросов) и читая тексты.)
Это - ИИ-индексация. С ней вы можете сделать самый мощный в мире суперкомпьютер из Pentium I, что недавно продемонстрировал Гугл.
Синонимичные кластеры Искусственого Интеллекта.
Сынонимичные кластеры есть замена языкам программирования. Есть предложение:
-- Иван и Марфа весело смеются, она любит это.
ИИ-разбор получает следующий набор (уже осмысленых фраз):
- и Иван весело смеётся
- и Марфа весело смеётся
- она любит смеятся
- Марфа любит смеятся
- она любит это
- Марфа любит это
- это любимо ею
- это любимо Марфой
- смех любим ею
- смех любимо Марфой.
Набор об Иване есть синонимичный кластер (одна фраза):
- и Иван весело смеётся
Набор об Марфе есть синонимичный кластер (много фраз):
- и Марфа весело смеётся
- она любит смеятся
- Марфа любит смеятся
- она любит это
- Марфа любит это
- это любимо ею
- это любимо Марфой
- смех любим ею
- смех любимо Марфой.
Программирование есть перевод заданий (спецификаций) в код, когда происходит структуирование (программистом, человеком) текста в набор комманд. ИИ делает то же самое, извлекая синонимичные кластеры и назначая определёные действия каждой фразе (петтерну по заморски).
Например автомобили Гугля руководствуются извлечёными из текстов инструкций коммандами.