L
Loki Talk own messenger · AI orchestra · E2EE
live · loki.talk E2EE AI · 70+
white-label messenger + private AI cluster

Свой мессенджер.
Свой AI-оркестр.
Свой контур.

Loki Talk — это не «ещё один веб-чат», а полноценный частный коммуникационный контур на собственном домене: защищённые сообщения E2EE, групповые звонки через Matrix-RTC + LiveKit, мульти-региональный TURN-каскад с резервом в РФ — и встроенный оркестр из 70+ нейросетей: локальные модели на собственных GPU и CPU плюс облачные Claude / GPT / Gemini / Grok / DeepSeek через единый шлюз LiteLLM. Один домен — мессенджер, звонки, веб-AI с поиском, RAG и оркестрацией агентов.

70+
AI-моделей в оркестре
4
TURN-региона + RU-фолбэк
100%
E2EE Olm / Megolm
3
собственных серверa
Matrix · Synapse · LiveKit Olm · Megolm · E2EE coturn cascade · 4 регионa Claude · GPT · Gemini · Grok DeepSeek · Qwen · Llama · Dolphin Open WebUI · LiteLLM · SearXNG · Tika RTX 4090 ×2 · Ryzen 9 · NVMe 8 TB RU-fallback · sing-box · VLESS+Reality Matrix · Synapse · LiveKit Olm · Megolm · E2EE coturn cascade · 4 регионa Claude · GPT · Gemini · Grok DeepSeek · Qwen · Llama · Dolphin Open WebUI · LiteLLM · SearXNG · Tika
Что внутри

Семь несущих систем под одним доменом

Не клиент над чужим бэкендом, а собственная инженерная сборка из открытых протоколов и собственных моделей.

// stack@loki.talk

E2EE по умолчанию

Личные и групповые комнаты шифруются на устройстве: сервер транслирует пакеты, но не видит контент. Olm + Megolm, recovery key, кросс-подписи устройств.

OlmMegolmcross-signing

AI-оркестр на 70+ моделей

Один шлюз LiteLLM маршрутизирует запросы между локальными моделями (Hive GPU + Hetzner CPU) и облачными (OpenRouter: Claude, GPT, Gemini, Grok, DeepSeek). Любая нейронка отвечает по OpenAI-совместимому API.

LiteLLMOllamaOpenRouter

TURN-каскад · 4 региона

Звонки и видеозвонки автоматически выбирают ближайший relay: основной Hetzner, резерв в РФ (5.188.24.188), Cloudflare TURN, ExpressTURN. Если основной упал — клиенты идут по следующему ICE-кандидату без разрыва соединения.

DERUCDNEU

Контроль на каждом слое

Свой DNS на Gcore, свой реверс-прокси Caddy с автоматическим Let's Encrypt, свой Synapse + Postgres, своя медиа-инфраструктура, свой Element-fork с глассморфным дизайном и свой бренд от лендинга до APK.

Gcore DNSCaddySynapsePostgreSQLLet's Encrypt

Мосты, виджеты, SIP, боты

WhatsApp / Telegram / Signal-bridges, корпоративные SIP-телефонии, bot-аккаунты для уведомлений, виджеты для документов и видеовстреч, Matrix-RTC для групповых звонков. Один протокол — десятки точек подключения внешнего мира.

WhatsAppTelegramSIPMatrix-RTCLiveKitBots

Open WebUI с поиском и RAG

Веб-интерфейс ai.loki.talk: чат с любой моделью, переключение «глубокого рассуждения», web-поиск через свой SearXNG, загрузка PDF/DOCX через Tika, личная база знаний, мультиагентные сценарии.

SearXNGTikaRAG

Glassmorphism UI

Полностью переработанный фронт — единый визуальный язык для лендинга, веб-клиента (Element-fork) и Android-приложения. Тёмный glass, мягкие градиенты, северное сияние, Inter + JetBrains Mono.

Interaurorabackdrop-blur

RU «белые списки» — есть план

Готов второй слой доступа: VLESS+Reality, sing-box-bridges, AmneziaWG, проксирование через VK Cloud / Yandex Cloud (под белыми списками). Цель: до 15 ГБ/мес стабильной связи даже при глобальных отключениях.

VLESSRealitysing-boxAmneziaWG
AI orchestra

70+ нейросетей под одним OpenAI-совместимым шлюзом

Локальные модели на собственных GPU/CPU + облачные через OpenRouter. Маршрутизирует LiteLLM, всё доступно через llm.loki.talk/v1 и веб-интерфейс ai.loki.talk.

// llm.loki.talk/v1

Hivecompute · GPU RTX 4090 ×2 · 48 GB VRAM

17 моделей в Ollama · быстрый чат, vision, embeddings, code
qwen3:30b-a3b · latest
17 GB
reasoning
qwen3-coder:30b-a3b
17 GB
code
qwen2.5:32b
19 GB
chat
qwen2.5-coder:32b
19 GB
code
deepseek-r1:32b
19 GB
reasoning
deepseek-r1:14b
9 GB
reasoning
llama3.3:70b-instruct-q4
42 GB
chat
llama3.2-vision:11b
7.9 GB
vision
llava:13b
8.0 GB
vision
dolphin-llama3:8b
4.7 GB
tools
mistral-nemo:12b
7.1 GB
chat
phi4:14b
9.1 GB
chat
gemma2:27b
15 GB
chat
command-r:35b
20 GB
RAG
nomic-embed-text
274 MB
embed
mxbai-embed-large
670 MB
embed
snowflake-arctic-embed
335 MB
embed

Hetzner · CPU Ryzen 9 3900 · 128 GB RAM

53 модели в Ollama · большой пул для batch и долгих задач
qwen2.5:72b
47 GB
chat
deepseek-coder-v2:16b
9.4 GB
code
deepseek-r1:7b
4.7 GB
reasoning
llama3.1:70b
42 GB
chat
llama3.2:3b
2.0 GB
light
mistral-large:123b
73 GB
chat
mixtral:8x7b
26 GB
MoE
codestral:22b
13 GB
code
starcoder2:15b
9 GB
code
granite-code:34b
19 GB
code
phi3:14b
7.9 GB
chat
solar:10.7b
6.1 GB
chat
nous-hermes2:34b
19 GB
tools
wizardcoder:33b
19 GB
code
orca-mini:13b
7.4 GB
chat
vicuna:33b
19 GB
chat
openchat:7b
4.1 GB
chat
…ещё 36 моделей
all

OpenRouter · Cloud Claude · GPT · Gemini · Grok · DeepSeek · Qwen

Облачные топ-модели подключены через тот же LiteLLM-шлюз — переключаются одной строкой
claude-sonnet-4.5 · anthropic
200K ctx
flagship
claude-opus-4.1 · anthropic
200K ctx
reasoning
gpt-5 · openai
256K ctx
flagship
gpt-5-mini · openai
128K ctx
fast
gemini-2.5-pro · google
1M ctx
long
gemini-2.5-flash · google
1M ctx
fast
grok-4 · xAI
256K ctx
chat
deepseek-v3.2 · deepseek
128K ctx
reasoning
deepseek-r1-0528 · deepseek
128K ctx
reasoning
qwen-3-max · alibaba
128K ctx
chat
llama-4-405b · meta
128K ctx
chat
Open WebUIai.loki.talk

Веб-интерфейс ко всему оркестру: переключение моделей, web-поиск SearXNG, RAG через Apache Tika, история сессий, память пользователя, multi-agent.

  • Чат + Deep Reasoning
  • Web-search · SearXNG
  • Загрузка PDF/DOCX/изображений
LiteLLM Gatewayllm.loki.talk/v1

OpenAI-совместимый шлюз для всех моделей. Подходит для Cursor, opencode, claude-code, Claude Desktop, любого OpenAI SDK.

  • Один master key
  • Кэш + квоты
  • Failover между провайдерами
opencode CLIopensource agentic

Локальный агент-в-терминале (open-source аналог Claude Code), подключён к нашему LiteLLM. Полный набор слитого Claude-Code исходника зеркалируется через MCP-сервер для исследования.

  • opencode 1.4+
  • MCP-explorer для архитектуры
  • Cursor / Claude Desktop ready
Инфраструктура

Три собственных сервера в трёх ролях

Никакого «арендованного клиента» — каждый слой работает на железе, к которому есть полный root-доступ.

// 3 nodes · 2 GPU · 8 TB NVMe
matrix-boxDE · Frankfurt

Публичный фронт: Caddy + TLS, Synapse, LiveKit, Element-fork, Postgres, медиа-CDN. Здесь живёт `loki.talk` и весь web-edge.

  • Caddy reverse proxy
  • Synapse + PostgreSQL
  • LiveKit (group calls)
  • autossh-tunnel в hivecompute
hivecomputeGPU · 2 × RTX 4090

AI-молотилка: Ollama с GPU-офлоадом, Open WebUI, LiteLLM, SearXNG, Tika. Сюда уходят все запросы к локальным моделям.

  • 17 моделей в VRAM
  • Open WebUI · LiteLLM
  • SearXNG + Tika RAG
  • systemd auto-update
hetznerCPU · Ryzen 9 + 8 TB NVMe

Большой холодный пул: 128 ГБ RAM, 4×1.92 TB NVMe в RAID, 53 CPU-модели Ollama, объектный сторадж и место под бэкапы Synapse / медиа.

  • 128 GB ECC RAM
  • 4 × 1.92 TB NVMe
  • 53 CPU-модели
  • S3-совместимое хранилище
ru-turn (5.188.24.188)RU · резервный TURN-узел

Отдельный узел в РФ для проксирования звонков и медиа в случае GeoIP-ограничений. coturn с тем же `static-auth-secret`, TLS на 5349 (TURNS), unified DNS под `loki.talk`. Включается автоматически, когда клиент видит ICE-кандидата с лучшей RTT из российских сетей или когда основной Hetzner недоступен.

  • 1 vCPU · 4 GB RAM · 60 GB SSD
  • TURN/TURNS 3478, 5349, 49152-65535/UDP
  • Сертификат Let's Encrypt (panel.loki.talk)
  • Auto-reload coturn после renew
  • WireGuard-mesh с matrix-box
  • Готов под sing-box bridge для inbound
TURN cascade

Звонки не падают. Никогда.

Synapse и LiveKit отдают клиенту весь набор TURN-узлов. ICE сам выбирает быстрейший по RTT, а если узел недоступен — мгновенно переключается без разрыва.

// ICE failover
PRIORITY 1
🇩🇪
Hetzner · DE Основной TURN/TURNS, минимальный RTT для EU и большинства глобальных клиентов. turn:loki.talk:3478
turns:loki.talk:5349
RU FALLBACK
🇷🇺
ru-turn · 5.188.24.188 Резерв для клиентов из РФ или при недоступности основного узла. Тот же secret — без переобучения клиентов. turn:5.188.24.188:3478
turns:panel.loki.talk:5349
PRIORITY 2
☁️
Cloudflare TURN Anycast-CDN-relay по всему миру: запасной маршрут на случай блокировки нашего IP. turn:turn.cloudflare.com:3478
PRIORITY 3
🌐
ExpressTURN Третий независимый провайдер: страхует от любого глобального инцидента. turn:relay1.expressturn.com

Логика выбора: WebRTC ICE-checks делают connectivity check ко всем узлам и выбирают тот, что отвечает быстрее. Если узел внезапно умер — соединение мигрирует на следующий ICE-кандидат за <1 секунду. На стороне Synapse в `homeserver.yaml` и LiveKit в `livekit.yaml` все узлы перечислены, клиент получает их в `/_matrix/client/v3/voip/turnServer`.

Roadmap · устойчивость

Готовы к «белым спискам» РФ — заранее

Ноябрь 2025 → апрель 2026: на мобильных доступны только сервисы из белого списка. Мы строим второй слой доступа, который маскирует трафик под разрешённые протоколы и облака.

// stealth layer
VLESS + Reality + XHTTP

Маскировка под TLS-handshake популярных белых доменов. Не определяется DPI как VPN, выглядит как обычный HTTPS-трафик к крупным CDN.

xray-coreutls
sing-box bridge внутри клиента

Android-приложение получает встроенный sing-box (libbox). В настройках включается «Internal Bridge Mode» — трафик пакуется в маскированный канал без необходимости отдельного VPN.

libboxin-app
VK Cloud / Yandex Cloud прокси

Когда мобильный интернет режется до белого списка — наш relay живёт внутри VK Cloud / Yandex Cloud (они в белом списке по умолчанию). Клиент видит «разрешённый» хост, а трафик идёт к нашему Matrix.

VK CloudYC Object Storage
AmneziaWG · обфусцированный WireGuard

Резервный канал для админов и пользователей: модифицированный WG-протокол, который не палится сигнатурными DPI-фильтрами.

wireguardobfuscation
Domain fronting + ESNI

SNI-маскировка под крупные CDN-домены. Дополнительный уровень для обхода SNI-фильтров в эпоху белых списков.

CDNESNI
Целевой профиль · до 15 ГБ/мес

Режим экономии: оптимизация push-уведомлений, дельта-синхронизация, отдельный «light» mediarepo. Цель — стабильная связь даже при минимальной квоте «белого» интернета.

pushdelta-sync
Клиенты

Веб + Android в едином glass-стиле

Один визуальный язык работает и в браузере (Element-fork с переписанным UI), и в нативном Android-приложении.

// /app/ · APK

Веб-клиент Loki Talk

Открывается прямо из браузера — без установки, моментальные обновления UX, идеален для приглашений и быстрого онбординга.

Glass-overlay поверх Element: новый шрифт, северное сияние, переработанные карточки чатов и timeline.
Доступен по `/app/`: полный feature-set Element + наши кастомизации.
Web-search и AI прямо в чатах: через виджеты Open WebUI и LiteLLM.
Подходит для приглашений: ссылка на `loki.talk` сразу запускает контур.

Android · Loki Talk APK

Нативное приложение на Element Android (форк), полностью перебрендированное и в том же glass-дизайне. Готовится «Internal Bridge Mode» под белые списки РФ.

Push-уведомления: полноценный daily-use без активной вкладки браузера.
Свой бренд и иконка: в магазине пользователь видит «Loki Talk», а не чужого клиента.
Глубокие ссылки `loki.talk/...`: всё работает внутри приложения.
Готовится: sing-box bridge: один тумблер в настройках включает обфусцированный канал.
Почему сильнее обычного self-hosted

Не «инсталлятор» — а собственный продукт

Своя точка входа

Регистрация и логин выглядят как самостоятельный продукт, а не как чужой клиент над Matrix.

Своя продуктовая оболочка

Тексты, экраны, приглашения, ссылки на комнаты — всё работает внутри бренда `loki.talk`.

Своя AI-инфраструктура

Локальные модели крутятся на вашем железе — данные не уходят к OpenAI/Anthropic, если вы этого не хотите.

Своя устойчивость

Мульти-TURN, RU-fallback, готовые сценарии обхода белых списков — вы не зависите от одной точки отказа.

Подключение и доступ

Во всех совместимых клиентах основной адрес сервера — один:

Homeserver https://loki.talk

Для обычного пользователя достаточно знать только loki.talk. Внутренние технические идентификаторы скрываются white-label слоем интерфейса. После включения шифрования обязательно сохраните recovery key — он нужен для восстановления зашифрованной истории.

AI веб-интерфейс https://ai.loki.talk
OpenAI-совместимый API https://llm.loki.talk/v1
Другие устройства и совместимые приложения

Основной сценарий — наш веб-клиент `/app/` и Android-APK. Для совместимости работают все Matrix-клиенты: подключите их к `https://loki.talk`.

WhatsApp bridge

После входа можно подключить мост WhatsApp через чат с ботом и QR-авторизацию.