KӨZ News Hub
☀️ Улаанбаатар 13° Улаанбаатар
Солнечно
Температура: 13°C
Ощущается как: 12°C
Ветер: 12 км/ч NE
Влажность: 37%
USD 3 576 ₮ Доллар США
1 USD = 3 576 ₮
Без изменений за день
· EUR 4 151 ₮ Евро
1 EUR = 4 151 ₮
Без изменений за день
· RUB 50.51 ₮ Рубль
1 RUB = 50.51 ₮
Без изменений за день
· CNY 526 ₮ Юань
1 CNY = 526 ₮
Без изменений за день
· Brent $104.63 Нефть Brent (за баррель)
Цена: $104.63
Тренд: ▲ рост
· Алт $4 506 Золото (за тр. унцию)
Цена: $4 506
Тренд: ▼ снижение
Живой контур последнее обогащение 34 сек назад · данные на 22.05.2026

AI-редакция Центральной Азии

Семь страновых порталов на одном движке. Собственный AV DS — извлечение сущностей, кластеризация сюжетов, векторный поиск, RAG-ответы, контроль фактов и плагиата, переводы. Всё под капотом, без внешних SaaS-обёрток.

22 289
материалов
44 569
сюжетов
168 431
AI-обогащений
125 456
векторов
/ask · публичный RAG

Спросите что-нибудь о Центральной Азии

Живой эндпоинт работает прямо на этой странице. Векторный поиск в Qdrant (129 923 точки) → top-k контекст → DeepSeek с обязательными ссылками на источники.

Примеры:
⌘ + Enter · ответ обычно приходит за 4–9 секунд · rate-limit 10/мин
AV DS · движок

Шесть слоёв, через которые проходит каждая статья

От сырого RSS до упакованного сюжета с цитатами и переводами. Полный путь занимает 12–40 секунд.

1

Clustering · сюжеты

44 569сюжетов
193 357связей
4,3статей/сюжет
99%охват корпуса

Похожие материалы склеиваются в сквозные истории. На главной идут сюжеты, а не лента.

2

BERT · тональность

128 000статей
78,6%нейтральных
14,8%негативных
6,6%позитивных

rubert-tiny2-sentiment · оценка каждой публикации. Питает дашборд тона в стране и по темам.

3

RAG · /ask

129 923вектора
0,50ср. релевантность top-1
5,5 ссредний ответ
$0,0003стоимость запроса

multilingual-e5-small → Qdrant → DeepSeek в JSON-mode с обязательной ссылкой на источник.

4

Контроль качества

168 431enrichment-записей
96 594цитат экспертов
99,9%AI-disclosure
8ML-модераций/день

Факт-чекинг, плагиат, QA-score. Каждый материал получает оценку качества перед публикацией.

5

Переводы

5 063переводов
6языков
DeepSeekс сохранением смысла
hreflangсвязность доменов

Автопереводы каждого материала. Русский остаётся оригиналом, остальные генерятся и проходят контроль.

6

A/B заголовков

2активных экспериментов
GPTгенератор вариантов
CTRметрика принятия
3–5вариантов на заголовок

Модель предлагает 3–5 вариантов на каждую статью — лучший попадает в публикацию через 4 часа.

Рост

Ежедневный прирост корпуса

Данные за 30 дней. Пики — импорт архивных материалов, плато — реальный дневной поток.

1 539за период
34среднее в день
108max в день
20дней данных
Архитектура

От сбора RSS до генеративного ответа

Пять зон, каждая — отдельный сервис. Всё в Docker Compose, всё на одном VPS. Один внешний LLM-вендор, остальное open-source.

1

Ingestion

  • news-monitor · RSS 60+
  • fetcher · HTML-дожим
  • cron · таймеры
2

Core API

  • FastAPI · uvicorn
  • arq · async jobs
  • Admin · редакция
3

AV DS pipeline

  • embeddings
  • DeepSeek · JSON mode
  • BERT sentiment
  • NER · spaCy
4

Хранилище

  • Postgres 16 · корпус
  • Qdrant · векторы
  • Meilisearch · поиск
  • Redis · очереди
5

Доставка

  • Jinja SSR · 7 сайтов
  • imgproxy · медиа
  • Cloudflare · CDN
12/12 контейнеров healthy 99,9% uptime за 30 дней Zero external ML SaaS Развертывание с нуля · 1 час
API · для разработчиков

Подключитесь к корпусу за 3 строки

Публичный read-only API. Без ключей для базовых эндпоинтов. Для webhook-подписок и повышенных лимитов — свяжитесь с нами.

POST /api/ask RAG-ответ с цитатами · публичный
curl -X POST https://koz.news/api/ask \
  -H "Content-Type: application/json" \
  -d '{"question": "Что известно о курсе тенге?", "lang": "ru"}'

Лимит: 10 req/min · Ответ: answer, sources[], confidence, latency_ms, cost_usd

GET /api/data/daily-volume Ежедневный объём публикаций · публичный
curl "https://koz.news/api/data/daily-volume"

Ответ: [{site, day, count}] · используется на этой странице для графика ↓

GET /api/data/pulse Живой пульс ленты · публичный
curl "https://koz.news/api/data/pulse"

Плюс: /api/data/persons, /api/data/topics, /api/data/geo, /api/data/entities, /api/data/timeline, /api/data/summary

GET /api/articles Полнотекстовая лента · требует ключ
curl -H "X-API-Key: $TOTAL_KEY" \
  "https://koz.news/api/articles?q=kaspi&limit=20"

Полный контент статей. Запросите ключ через форму внизу →

POST /api/webhooks Подписка на события · требует ключ
curl -X POST https://koz.news/api/webhooks \
  -H "X-API-Key: $TOTAL_KEY" \
  -d '{"event":"article.published", "url":"https://your.app/hook", "filter":{"tag":"Kaspi"}}'

События: article.published, story.updated, person.enriched

Для редакций

Инструменты, которых у вас ещё нет

Три AI-режима поверх живой ленты: ответить на вопрос по архиву, поговорить с конкретной статьёй, получить основу для утреннего брифинга за 10 секунд.

01 · сейчас в проде

Архивный /ask

Вопрос на русском или казахском → векторный поиск по 195 тыс материалов → ответ со ссылками на источники. Лекарство от 30 минут ручного поиска перед каждым текстом.

Какие проекты были анонсированы в Актобе за год?
За год в Актобе анонсированы проекты… 1 2 3
≈ 5 сек · 3 источника · confidence high
Попробовать выше ↑
02 · май 2026

Reader-AI · чат с материалом

В каждой статье «спроси про этот материал»: сократи до трёх тезисов, объясни простым языком, переведи, найди связанные материалы. Зачем: время на сайте +35–60%.

Перефразируй первый абзац проще
Токаев сделал два заявления: первое — о бюджете, второе — о госаппарате…
≈ 1.5 сек · контекст — текущая статья
В разработке
03 · июнь 2026

Daily brief · утренняя бюллетень-подборка

В 6:00 алгоритм собирает 10 ключевых сюжетов за сутки с тезисами и источниками. Придёт в email и Telegram — готовая повестка для планёрки.

Пусть приходит в 6:00 каждую правду · акцент на KZ
24 апр · ТОП-5 · Казахстан
1. Нацбанк оставил ставку…
2. Актобе: новый завод…
Формат: markdown + ссылки · подписка через бота
В разработке
Юнит-экономика

Полный стек — $50 в месяц

Платформа работает на одном VPS. Всё обогащение делает AV DS — штат редакции не нужен.

≈ $32/месVPS · Hetzner CX42
≈ $3/месдомены · DNS
≈ $15/месDeepSeek · 168k enrich
≈ $50/месИТОГО · прод-контур
$0,00033стоимость одного /ask
$0,0008стоимость одного enrich
< $0,002полная цена одного материала
$15–20то же у традиционного СМИ
Чего нет у региональных СМИ

Три сценария, которые невозможно повторить без инфраструктуры

Не табличка галочек, а конкретные редакционные задачи. Каждая требует всего стека, поэтому у tengrinews, zakon.kz и kursiv этого нет.

01

«Спроси у архива»

Журналист пишет вопрос на русском или казахском. Система векторно ищет 5 наиболее релевантных материалов из 195 000, собирает контекст и возвращает ответ со ссылками. За 5 секунд вместо 30 минут ручного поиска.

Требует: Qdrant + embeddings-сервис + LLM + обёртка RAG · у конкурентов — 0/4.
02

Живой сюжет

Редактор открывает любую тему — система автоматически собирает все 5–20 статей в хронологию, строит таймлайн, подтягивает упомянутых персон и организации. Без ручной модерации.

Требует: кластеризация эмбеддингов + граф сущностей + NER · у конкурентов — лента без связей.
03

Публикация на 7 рынках

Материал на русском автоматически переводится на казахский, узбекский, кыргызский, таджикский и монгольский, проходит фактчек и уходит на 7 доменов с правильным hreflang. Один автор, семь аудиторий.

Требует: автоперевод + multi-site движок + hreflang-карта · у конкурентов — один домен.
Что дальше

Два месяца вперёд · пункты, над которыми работаем сейчас

Честно: это ещё не продакшен, но попадёт в прод до конца июня. Никаких «в разработке 3 года» обещаний.

Май 2026
  • Evals + hallucination score — публичная метрика качества /ask
  • Hybrid search — BM25 + vector + cross-encoder reranker
  • Глобальный Ask в хедере — AI-компаньон на каждой странице
  • Reader-AI — чат с конкретной статьёй
Июнь 2026
  • Developer portal — API-ключи, webhook, usage-аналитика
  • Daily AI-briefing — email + Telegram с топ-сюжетами
  • Платный /ask Pro — безлимит, deeper context, экспорт
  • MCP-сервер — Total как инструмент в ChatGPT/Claude/Perplexity
Июль — сентябрь
  • White-label — AV DS как SaaS для медиа региона
  • Мультимодальность — поиск по фото и аудио (CLIP + Whisper)
  • Auto-reels — 30-сек видео из каждого сюжета для Reels/TikTok
  • C2PA provenance — крипто-подпись каждой публикации
Техстек

Чем всё это собрано

Зрелые open-source компоненты. Единственный внешний вендор — DeepSeek. Без vendor lock.

BACKEND
Python 3.12FastAPISQLAlchemy 2 psycopg 3arqhttpxPydantic
FRONTEND
Jinja2 SSRVanilla JSCSS vars PWAChart.js
ХРАНИЛИЩЕ
Postgres 16QdrantMeilisearchRedis
AV DS
DeepSeek JSON modemultilingual-e5-small rubert-tiny2-sentimentspaCyCustom RAG
DEVOPS
Docker ComposeCloudflareGitHub imgproxyumami
Обсудить

Хотите подключиться?

Три сценария, по которым к нам обращаются: инвестиции в раунд, партнёрский API, white-label для своего издания. Напишите одним предложением, что вам нужно — ответим в течение суток.

  • Investor deck (PDF) · готов к отправке по запросу
  • API с расширенными лимитами · индивидуальный тариф
  • White-label AV DS · для новых рынков ЦА
Ответим на указанный контакт в течение суток. Данные не передаём третьим сторонам.