Инфраструктура открытых городских данных GitHub adm-iola

Новая схема работы с городскими данными для эпохи ИИ-агентов

ИИ-агента сегодня может собрать почти любой человек. Но агенту нужны не догадки большой языковой модели, а точные, актуальные и структурированные данные.

Йолташ создает такую среду: городские данные собираются в Цифровом мозге, приводятся к единому виду и становятся доступны сайтам, сервисам, разработчикам и ИИ-агентам через контролируемые интерфейсы.

Почему старой схемы уже недостаточно

Городская информация обычно лежит в разных местах: в ГИС, реестрах, таблицах, PDF-документах, ведомственных системах, на сайтах и в отдельных базах. Формально данные могут быть открыты, но для ИИ-агента они часто не готовы к работе.

Чтобы агент мог использовать такие источники, разработчику приходится писать парсеры, загрузчики, анализаторы, индексы, RAG-системы и программы для очистки и сопоставления данных. Это сложно, долго и каждый раз делается заново.

Как сейчас

  • данные разбросаны по разным системам;
  • для каждого источника нужна отдельная обработка;
  • агент может ошибаться или угадывать;
  • разработчик вынужден собирать свой технический слой.

Как в Йолташе

  • данные готовятся в едином городском ядре;
  • объекты очищены, сопоставлены и структурированы;
  • агент подключается к готовому MCP-серверу;
  • ответ строится на проверенном источнике.

Почему ИИ-агенту нужен понятный доступ к данным

Современный ИИ умеет хорошо понимать вопрос и объяснять ответ человеческим языком. Но сам по себе ИИ не является городской базой данных. Если спросить его о школе, доме, адресе, учреждении или городском объекте, ему нужно откуда-то взять точные сведения: название, адрес, ИНН, координаты, статус, источник и дату обновления.

Без специальной подготовки создателю сервиса приходится заново решать одну и ту же задачу: где взять данные, как прочитать их из разных систем, как очистить ошибки, как связать один и тот же объект в нескольких источниках и как не раскрыть лишнюю служебную информацию. В результате появляются разрозненные решения, которые сложно проверять, поддерживать и повторно использовать.

В 2024 году компания Anthropic предложила Model Context Protocol, или MCP. Простыми словами, MCP - это единый и безопасный способ дать ИИ-агенту доступ к инструментам. Не к “любой базе напрямую”, а к заранее разрешенным действиям: найти объект, получить карточку, проверить поле, выполнить поиск или обратиться к нужному сервису.

Именно поэтому MCP стал важным направлением в развитии ИИ-агентов. Он похож на стандартный разъем: если инструмент подключен по понятным правилам, разные агенты могут работать с ним одинаково. Это делает ИИ-системы более управляемыми: видно, какой инструмент вызван, какие данные получены и на чем основан ответ.

Без общего подхода

Для каждого источника пишется отдельный парсер или подключение. Один сервис берет данные из таблицы, другой из сайта, третий из базы. Ошибки и расхождения приходится искать вручную.

С MCP-подходом

ИИ-агент работает не с хаотичным набором файлов и баз, а с разрешенными инструментами. Он просит инструмент выполнить конкретное действие и получает структурированный результат.

Но для города одного MCP недостаточно. MCP объясняет, как ИИ-агенту безопасно вызвать инструмент. А Йолташ отвечает на другой вопрос: какие именно городские данные должны стоять за этим инструментом, как они подготовлены и почему им можно доверять.

Городские данные сложнее обычного списка. Один объект может одновременно иметь адрес, координаты, кадастровую информацию, организацию, ИНН, принадлежность к территории, связь с документом и несколько источников обновления. Эти сведения приходят из ГИС, реестров, ведомственных систем, таблиц, документов и открытых сервисов. Их нужно собрать, очистить, сопоставить и регулярно обновлять.

MCP отвечает за подключение

  • какой инструмент может вызвать ИИ-агент;
  • какое действие этот инструмент выполняет;
  • какой результат возвращается агенту;
  • как ограничить доступ только разрешенными операциями.

Йолташ отвечает за городские данные

  • откуда сведения поступают в цифровой мозг;
  • как один городской объект сопоставляется в разных источниках;
  • какие поля можно публиковать для жителей и разработчиков;
  • как эти данные выдаются сайту, API, MCP-серверу, CLI и skills.
Ключевая идея: MCP дает ИИ-агенту безопасный способ вызвать инструмент. Йолташ делает так, чтобы за этим инструментом стояли не случайные файлы и таблицы, а подготовленные и проверенные городские данные.
1. Данные собираются.
Цифровой мозг получает сведения из ГИС, реестров, ведомственных систем и открытых источников.
2. Данные приводятся к порядку.
Объекты очищаются, сопоставляются, получают связи, источники и понятную структуру.
3. Данные выдаются безопасно.
Сайт, FastAPI, MCP-сервер, CLI и skills получают только те сведения, которые разрешены для конкретного сценария.

Так Йолташ становится не просто сайтом, API или набором репозиториев. Это предлагаемая схема работы с данными городской инфраструктуры в эпоху ИИ-агентов: город формирует надежный контур данных, а люди, сервисы и агенты подключаются к нему через безопасные и повторяемые интерфейсы.

Для кого это создается

Для жителей

Городские сервисы и ИИ-помощники смогут отвечать по проверенным данным: где находится учреждение, какие у него контакты, есть ли объект в публичном слое, когда сведения обновлялись.

Для разработчиков

Не нужно заново собирать парсеры, справочники и индексы. Разработчик подключается к готовому API или MCP-серверу и работает с подготовленными городскими данными.

Для администрации

Один подготовленный контур данных можно использовать на сайте, в сервисах, отчетах, проверках качества и новых ИИ-инструментах без ручного копирования одних и тех же таблиц.

Для ИИ-агентов

Агент получает не прямой доступ к внутренним базам, а понятные разрешенные инструменты: найти объект, получить карточку, проверить поле, объяснить источник ответа.

Что меняется на практике

Страницы сайта обновляются из данных.
Например, список учреждений может строиться из цифрового мозга, а не из вручную сверстанной таблицы.
Один слой используется в разных каналах.
Те же сведения доступны сайту, API, MCP-серверу, CLI и skills, поэтому уменьшается риск расхождений.
ИИ-агент проверяет факт перед ответом.
Он обращается к разрешенному инструменту, получает данные и только потом формулирует ответ человеку.
Новые сервисы запускаются быстрее.
Разработчику не нужно заново искать источник, чистить данные и придумывать собственную схему доступа.

Почему это не просто чат-бот

Обычный чат-бот отвечает текстом и часто опирается на знания модели или заранее написанные сценарии. Йолташ строит инфраструктуру, где ИИ-агент получает проверенные городские данные, вызывает разрешенные инструменты и может показать, на каком источнике основан ответ.

Обычный чат-бот

  • может отвечать без проверки источника;
  • часто не знает, когда данные обновлялись;
  • сложно переиспользует сведения в других сервисах;
  • не всегда понятно, откуда взялся ответ.

Йолташ

  • сначала обращается к подготовленному городскому источнику;
  • работает через API, MCP, CLI и skills;
  • использует один контур данных для разных сервисов;
  • делает ответ проверяемым и повторяемым.

Цифровой мозг - ядро Йолташа

Цифровой мозг - это живая система данных городского округа «Город Йошкар-Ола». Она хранит сведения об объектах городской инфраструктуры, организациях, адресах, территориях, учреждениях и связанных с ними данных.

64 слоя данных уже сформированы внутри Цифрового мозга
12,3 млн записей об объектах городского округа «Город Йошкар-Ола»
обновления данные периодически подтягиваются из ГИС, реестров и сервисов

Цифровой мозг подключается к НСПД, ФИАС, ГИС ЖКХ, ЕГРЮЛ и другим государственным информационным системам, реестрам и источникам. Данные обновляются, очищаются, сопоставляются и приводятся к единой структуре.

Как к данным подключаются сайты, люди и ИИ-агенты

FastAPI

Простой способ отдавать данные сайтам и приложениям. Например, страница сайта администрации может получать список школ из Цифрового мозга, а не хранить его вручную в верстке.

MCP-сервер

Мост между ИИ-агентом и городскими данными. Агент получает разрешенные инструменты: найти объект, открыть карточку, проверить адрес, получить нужное поле.

IOLA CLI

Готовая программа, которую может установить житель города на свой компьютер. Пользователь пишет обычным языком, а CLI обращается к городским данным, API, MCP и подключенным сервисам.

В CLI могут работать локальные модели, российские LLM и зарубежные LLM. Функционал можно расширять новыми tools и skills.

Основной сценарий сейчас - Windows 10/11. Для Linux и macOS доступна установка через Node.js и npm. Мобильная версия рассматривается как отдельная оболочка поверх той же агентной логики.

Skills

Навыки для конкретных задач. Skill объясняет агенту, как работать со школами, детскими садами, почтой, файлами, диском или новым городским слоем.

Что уже открыто

Публичный MCP-сервер сейчас содержит первые два тестовых слоя: школы и детские сады. Это стартовая публикация для запуска и проверки схемы. Следующие направления Цифрового мозга подключаются по мере проверки качества данных, состава публичных полей и правил безопасной публикации.

школы детские сады адреса контакты ИНН проверка фактов
Один источник.
Данные готовятся в Цифровом мозге один раз и используются на сайте, в API, MCP, CLI и skills.
Меньше ручной работы.
Создателю ИИ-агента не нужно писать парсеры и собирать RAG-слой для каждого источника.
Больше доверия к ответам.
Агент работает не по памяти модели, а через разрешенный интерфейс к актуальным городским данным.