The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Подборка открытых больших языковых моделей для локального использования

11 Feb 2025
Подборка открытых больших языковых моделей для локального использования
Открытые большие языковые модели для запуска на своём сервере:
  • DeepSeek-R1 -китайская модель, охватывает 671 миллиард параметров и учитывает контекст в 128 тысяч токенов.
  • Granite - модель от IBM, 8 миллиардов параметров.
  • InternVL - модель, способная обрабатывать визуальную информацию. 5-78 млрд параметров.
  • OLMo 2 - полностью открытая модель, 7 и 13 млрд параметров.
  • Phi-4 - модель от Microsoft, нацеленная на решение логических задач. 15 млрд параметров.
  • Qwen - китайская модель, 72 млрд параметров, 128 тысяч токенов. Есть вариант для обработки визуальной информации.
  • SmolLM2 - легковесные модели (135 млн, 360 млн и 1.7 млрд параметров), рассчитанные на резюмирование информации и обработку текста.
  • all-MiniLM-L6-v2, 23 млн параметров, подходит для встраивания в приложения.

Движки для исполнения больших языковых моделей: llama.cpp, ollama, koboldcpp.

https://github.com/suncloudsmoon/awesome-open-source-ai
Машинное обучение

 Добавить ссылку
 
 Поиск ссылки (regex):
 

Последние заметки
<< Предыдущие 15 записей
- 18.04.2023 Перевод шифрованного раздела на LUKS2 и более надёжную функцию формирования ключа
- 31.03.2023 Пример правил nftables с реализацией port knoсking для открытия доступа к SSH
- 27.02.2023 Обновление сертификатов oVirt
- 20.11.2022 Решение проблемы со шрифтами в Steam после выставления времени после 2038 года
- 18.11.2022 Раскладка клавиатуры для ввода символов APL
- 10.09.2022 Настройка СУБД Postgresql для аутентификации пользователей через Active Directory
- 09.09.2022 Настройка СУБД PostgreSQL 13 под управлением Pacemaker/Corosync в Debian 11
- 08.09.2022 Создание виртуальных машин с помощью Qemu KVM
- 25.07.2022 Создание программ под SynapseOS
- 24.07.2022 Случайная задержка в shell-скрипте, выполняемом из crontab (без башизмов)
- 03.07.2022 Выборочное туннелирование сайтов через WireGuard
- 19.05.2022 Настройка шрифтов для консоли и терминала
- 26.02.2022 Тестирование хелловорлда под 17 платформ одним скриптом
- 23.02.2022 Скрипт для конвертации архива gz в lzma
- 06.12.2021 Сравнение методов исключения разработки на JavaScript для веб технологий
Следующие 15 записей >>




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру