练习时长两年半

鸡你太美

大道至简

IKUN-LLM 是一个从零手写大语言模型训练全链路的开源社区。20+ 仓库覆盖分词器、预训练、SFT、DPO、GRPO、MoE、蒸馏、推理、多模态到部署，每一行代码都用 PyTorch 原生实现，拒绝黑盒。

加入 IKUN GitHub→

ikun-2.5B

练习生的全能大模型

26M 参数，从零手写，PyTorch 原生实现

探索 GitHub→

train_pretrain.py

import torch
from model import MiniMindForCausalLM, MiniMindConfig

# 26M params - 从零开始训练
config = MiniMindConfig(
    hidden_size=512,
    num_hidden_layers=8,
    num_attention_heads=8,
    num_key_value_heads=2,   # GQA
    vocab_size=6400,
)

model = MiniMindForCausalLM(config)
optimizer = torch.optim.AdamW(model.parameters(), lr=5e-4)

# 预训练循环
for epoch in range(epochs):
    for batch in dataloader:
        loss = model(
            input_ids=batch["input_ids"],
            labels=batch["labels"],
        ).loss
        loss.backward()
        optimizer.step()
        optimizer.zero_grad()

print("练习时长两年半，模型训练完成!")

ikun 全家桶

完整链路

从分词器到预训练.py

# ikun-tokenizer
from tokenizers import Tokenizer
tokenizer = Tokenizer(BPE())
tokenizer.train(files, trainer)

# ikun-pretrain
model = MiniMindForCausalLM(config)
for batch in dataloader:
    loss = model(input_ids, labels=labels).loss
    loss.backward()
    optimizer.step()

ikun 们都在说

来自全球 ikun 的真实评价

“ikun 的代码写得比我打篮球还丝滑”

小小黑子A

“自从用了 ikun-2.5B，我的模型也学会了唱跳 Rap”

AAI练习生

“练习时长两年半，终于把 Transformer 搞懂了”

坤坤坤学徒

“ikun-GRPO 的实现比 DeepSeek 论文还好读，太感动了”

强强化学习摸鱼人

“在鸡乐盒里找到了人生的意义”

哲哲学家坤

“26M 参数就能对话，比我的篮球技术还高效”

参参数精算师

“ikun-tokenizer 让我理解了为什么 LLM 不会打篮球”

分分词器研究员

“ikun 的代码写得比我打篮球还丝滑”

小小黑子A

“自从用了 ikun-2.5B，我的模型也学会了唱跳 Rap”

AAI练习生

“练习时长两年半，终于把 Transformer 搞懂了”

坤坤坤学徒

“ikun-GRPO 的实现比 DeepSeek 论文还好读，太感动了”

强强化学习摸鱼人

“在鸡乐盒里找到了人生的意义”

哲哲学家坤

“26M 参数就能对话，比我的篮球技术还高效”

参参数精算师

“ikun-tokenizer 让我理解了为什么 LLM 不会打篮球”

分分词器研究员

“用 ikun-V 给坤坤照片做了图文理解，它说：鸡你太美”

多多模态玩家

“DPO 对齐之后，模型终于学会了只说好听的话”

对对齐工程师

“ikun-MoE 的路由策略比我选外卖还智能”

专专家路由器

“三块钱训了个大模型，比我买奶茶还便宜”

节节俭练习生

“ikun-deploy 一键部署，比我投三分球还准”

运运维坤

“从零手写代码的快乐，只有 ikun 能懂”

原原生代码爱好者

“看完 ikun-basics 才知道，原来 AI 也需要练习两年半”

入入门选手

“用 ikun-V 给坤坤照片做了图文理解，它说：鸡你太美”

多多模态玩家

“DPO 对齐之后，模型终于学会了只说好听的话”

对对齐工程师

“ikun-MoE 的路由策略比我选外卖还智能”

专专家路由器

“三块钱训了个大模型，比我买奶茶还便宜”

节节俭练习生

“ikun-deploy 一键部署，比我投三分球还准”

运运维坤

“从零手写代码的快乐，只有 ikun 能懂”

原原生代码爱好者

“看完 ikun-basics 才知道，原来 AI 也需要练习两年半”

入入门选手

“用 ikun-V 给坤坤照片做了图文理解，它说：鸡你太美”

多多模态玩家

“DPO 对齐之后，模型终于学会了只说好听的话”

对对齐工程师

“ikun-MoE 的路由策略比我选外卖还智能”

专专家路由器

“三块钱训了个大模型，比我买奶茶还便宜”

节节俭练习生

“ikun-deploy 一键部署，比我投三分球还准”

运运维坤

“从零手写代码的快乐，只有 ikun 能懂”

原原生代码爱好者

“看完 ikun-basics 才知道，原来 AI 也需要练习两年半”

入入门选手

为什么选择 IKUN

大道至简，从零出发，和全球 ikun 一起练习

大道至简

拒绝黑盒，每一行代码都从零手写，PyTorch 原生实现，无第三方训练抽象。你看到的就是全部，不藏一行 magic。

完整链路

从 Tokenizer 到部署，覆盖 LLM 训练全链路，每个环节独立成库。预训练、SFT、DPO、GRPO、MoE、蒸馏、推理、多模态、部署一应俱全。

社区驱动

20+ 开源仓库，活跃的 ikun 社区。HuggingFace 模型一站式获取，Bilibili 视频教程同步更新，微信群实时交流。

加入 IKUN 开始练习

一起鸡你太美

HuggingFace→

鸡你太美

练习生的全能大模型

ikun 全家桶

从分词器到预训练

对齐与优化

推理与蒸馏

多模态与部署

探索 ikun 开源项目

ikun-2.5B

ikun-basics

ikun-tokenizer

ikun-pretrain

ikun-DPO

ikun-GRPO

ikun-Reason

ikun-MoE

ikun-Distill

ikun-V

ikun-deploy

ikun 表情包

鸡乐盒

ikun-mouse

ikun-ui

ikun 们都在说

为什么选择 IKUN

大道至简

完整链路

社区驱动

加入 IKUN 开始练习