Использование Lina и локального HY-MT1.5-1.8B для перевода записей локализации
ИИ-сотрудникиCommunity Edition+В этом руководстве описан практический сценарий локализации: локально развернуть небольшую специализированную модель перевода, открыть ее как OpenAI-совместимый сервис и настроить Lina для пакетного перевода записей локализации NocoBase.
Подход подходит для множества системных записей, текстов плагинов, меню, названий коллекций и подписей полей. В отличие от онлайн-моделей, локальные модели не зависят от внешних лимитов RPM, TPM и параллельности, а параллельность можно настраивать по возможностям машины и модели.
Обзор
В руководстве используются:
- Модель:
tencent/HY-MT1.5-1.8B-GGUF - Сервис инференса:
llama-server - Интеграция: OpenAI-compatible API
- AI Employee: Lina
- Точка входа: страница Localization Management
HY-MT1.5-1.8B — небольшая специализированная модель перевода. Она лучше подходит для коротких записей, UI-текстов и пакетного перевода. Общие чат-модели не рекомендуется выбирать первыми для задач локализации.
Предварительные условия
- Плагин Localization Management включен.
- Целевой язык включен.
- Записи локализации синхронизированы.
- Локальная машина или сервер может запускать
llama-server. - Сервис NocoBase может обращаться к HTTP-адресу
llama-server.
Развертывание HY-MT GGUF
Установка llama.cpp
В macOS можно установить через Homebrew:
Также можно использовать готовый бинарный файл llama.cpp или собрать его из исходного кода. Главное, чтобы был доступен llama-server.
Запуск OpenAI-совместимого сервиса
Запустите сервис с GGUF-моделью из Hugging Face:
Если ресурсы сервера ограничены, начните с -np 1 или -np 2, затем постепенно увеличивайте после проверки стабильности.
Проверка сервиса модели
После запуска llama-server проверьте состояние сервиса:
Затем проверьте перевод через OpenAI-совместимый API:
Если используется локальный файл модели, замените model на фактическое имя модели, возвращаемое или настроенное сервисом.
Если запрос долго не отвечает, модель может быть слишком медленной, параллельность слишком высокой или контекст слишком большим. Сначала уменьшите -np и параллельность перевода NocoBase, затем наблюдайте время ответа.
Настройка LLM-сервиса в NocoBase
Перейдите в System Settings -> AI Employees -> LLM service и добавьте LLM-сервис.
После настройки используйте Test flight, чтобы проверить модель.
Если NocoBase запущен в Docker, 127.0.0.1 указывает на сам контейнер и может не обращаться к сервису на хосте. Используйте IP хоста, адрес контейнерной сети или host.docker.internal.

