PULI-GPTrio

Венгерско-английско-китайская трилингвальная модель GPT-NeoX (7,67 миллиарда параметров). Обучена с использованием исходного кода GPT-NeoX от EleutherAI. Точка сохранения: 410 000 шагов. Набор данных: венгерский: 41,5 миллиарда слов (314 ГБ), английский: 61,9 миллиарда слов (391 ГБ), GitHub: 6 миллионов документов (33 ГБ), китайский: 98,7 миллиарда китайских символов (340 ГБ), (12 миллиардов не китайских токенов).

Метки: ,

Описание

Откройте для себя PULI-GPTrio: инструмент анализа текста, создания и обучения моделей.

Представляем PULI-GPTrio, трилингвальную модель GPT-NeoX с венгерским, английским и китайским языками, имеющую впечатляющие 7,67 миллиарда параметров! Модель была обучена на контрольной точке GPT-NeoX от EleutherAI на GitHub с более чем 410 000 шагов обучения. В набор данных входят 41,5 миллиарда слов на венгерском языке, 61,9 миллиарда слов на английском языке, 6 миллионов документов из GitHub и 98,7 миллиарда китайских символов (а также 12 миллиардов некитайских токенов).

Основные характеристики:
– Анализ текста, создание текста, построение и создание моделей и обучение моделей.
– Обширный набор данных, включающий 41,5 миллиарда венгерских слов, 61,9 миллиарда английских слов, 6 миллионов документов из GitHub и 98,7 миллиарда китайских символов.
– Модель с 7,67 миллиардами параметров и трилингвальная GPT-NeoX.
– 410 000 шагов в процессе обучения.
– Контрольная точка GPT-NeoX от EleutherAI на GitHub.

PULI-GPTrio идеально подходит для задач машинного обучения (МО) и искусственного интеллекта (ИИ), таких как анализ текста и данных, обучение моделей и создание контента. Благодаря своей невероятной комбинации мощных функций и обширных наборов данных этот инструмент ИИ может оказать неоценимую помощь любому бизнесу или частному лицу, работающему с большими объемами данных, поддерживаемых ИИ. Используйте PULI-GPTrio по максимуму в своих проектах МО и ИИ.

На английском: Discover PULI-GPTrio: AI Tool Analyzing Text, Building & Training Models. Introducing PULI-GPTrio, a Hungarian-English-Chinese trilingual GPT-NeoX model with an impressive 7.67 billion parameters! The model was trained using EleutherAI's GPT-NeoX Github Checkpoint with over 410,000 training steps. The dataset consists of 41.5 billion words for Hungarian, 61.9 billion words for English, 6 million documents from Github and 98.7 billion Chinese characters (along with 12 billion non-Chinese tokens). Key features: • Analyse text, create text, build and create models and train models • Extensive dataset with 41.5 billion Hungarian words, 61.9 billion English words, 6 million documents from Github and 98.7 billion Chinese characters • 7.67 billion parameter trilingual GPT-NeoX model • 410,000 steps in training • EleutherAI's GPT-NeoX Github Checkpoint PULI-GPTrio is ideal for machine learning (ML) and artificial intelligence (AI) tasks such as text and data analysis, model training and creation, and content creation. With its incredible combination of powerful features and expansive datasets, this AI tool can provide invaluable assistance to any business or individual looking to work with larger amounts of AI-powered data. Make the most of your ML and AI projects with PULI-GPTrio.

Добавлено: 2023-12-03 21:00:00

Детали

На входе

,

На выходе

,

Основано на

Задача

, , , , ,