О сайте

Нас повсюду окружает информация. Мы видим, слышим, чувствуем. Но человек не только пассивный потребитель информации - человек постоянно творит что-то новое, и от этого информации становится еще больше. Поэтому, чтобы не захлебнуться в информационном потоке, в нем необходимо ориентироваться.

Развитие сети Интернет дало нам поисковые системы. Они каждому человеку позволяют окунуться в информационное пространство мира. Их роль переоценить трудно, но их дело оплачивается дорогой ценой.

Количество информации растет, а это значит, что для ее обработки необходимо все больше и больше вычислительных ресурсов. Причем, рост вычислительных ресурсов должен опережать рост информации, и это - фактор естественного отбора поисковых систем. Кто не в силах обработать и представить необходимый минимумом информации, тот быстро уступает свое место.

Поэтому, ведущим игрокам требуется не только наращивать вычислительные мощности, но и оптимизировать алгоритм поиска. Путь оптимизации один - не обращать внимание на плохо структурируемые детали. Например, широко используется морфологическое преобразование слов, отчего в поиске игнорируются падежи, склонения и некоторые другие видоизменения искомой информации. Иногда это не существенно, а в ином случае может весьма затруднить поиск.

Но человеку свойственно привыкать и современные пользователи привыкли тем недостаткам, которыми страдают современные средства поиска. Очевидно, что это до поры до времени, и как только появятся средства, способные вести поиск по всему информационному полю, им будет обеспечен успех. Кто первый их получит, тот первым откроет всю информационную сокровищницу мира.

 

Проект NFOS.RU - это попытка приблизиться к информационной сокровищнице. Используемый на сайте алгоритм не зависит от языка, на котором написан текст, и может анализировать даже произвольный поток данных. Текущая реализация алгоритма приспособлена для анализа потока новостной информации, но этим его возможности не ограничиваются.

Важной особенностью алгоритма является то, что анализ производится полностью автоматически. Это не избавляет его от некоторых недостатков, но и придает ему существенное преимущество - в полностью автоматическом режиме на сайте публикуются все главные новости.

По просьбе одной из организаций также была реализована возможность извлечения из произвольного текста наиболее значимой информации. При этом поток информации значительно сокращается, а в результирующей выборке остаются самые важные детали. Это тоже делается в автоматическом режиме.

Возможности алгоритма этим не ограничиваются, так как его основой является способность производить полный анализ текста, который учитывает все его особенности.

Если проект NFOS.RU вас заинтересовал, вы можете ознакомиться с кратким описанием алгоритма на habrahabr'е или связаться с автором проекта.