Home
工程师部落
Cancel

大模型微调:如何基于ChatGLM3-6B+Lora

ChatGLM3-6B 微调 本目录提供 ChatGLM3-6B 模型的微调示例,包括全量微调和 P-Tuning v2。格式上,提供多轮对话微调样例和输入输出格式微调样例。 如果将模型下载到了本地,本文和代码中的 THUDM/chatglm3-6b 字段均应替换为相应地址以从本地加载模型。 运行示例需要 python>=3.10,除基础的 torch 依赖外,示例代码运行还需要...

字节码增强

px,pt,em换算表

pt (point,磅):是一个物理长度单位,指的是72分之一英寸。 px (pixel,像素):是一个虚拟长度单位,是计算机系统的数字化图像长度单位,如果px要换算成物理长度,需要指定精度DPI(Dots Per Inch,每英寸像素数),在扫描打印时一般都有DPI可选。Windows系统默认是96dpi,Apple系统默认是72dpi。 em(相对长度单位,相对于当前对象内文本的字体...

同步与异步 And 阻塞与非阻塞

同步与异步 关注两个进程间通信方式,同步是A进程调用B进程后需要等待B进程执行完成后,A进程才会继续向下执行。异步是A进程调用B进程后,A进程会立即继续向下执行 阻塞与非阻塞 了解 阻塞与非阻塞 首先需要熟悉两个概念 内核空间 与 用户空间 内核空间和用户空间,操作系统为了安全,用户空间是没有权限操作硬件设备的,比如网卡。所以需要通过内核空间与硬件设备间的交互。 内核空间存储的代...

ChartGPT 一些认识记录

几个基本概念 ChatGPT ChatGPT,全称聊天生成预训练转换器(英语:Chat Generative Pre-trained Transformer[2]),是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5、GPT-4架构的大型语言模型并以强化学习训练。 大型语言模型 大型语言模型,大型语言模型(LLM)是指包含数千亿(或更多)参数...

MySQL如何保证数据不丢失

EXPLAIN Output Columns 列名 说明 id 执行编号,标识select所属的行。如果在语句中没子查询或关联查询,只有唯一的select,每行都将显示1。否则,内层的select语句一般会顺序编号,对应于其在原始语句中的位置 select_ty...

MySQL计算索引高度

B+树索引介绍 B+树索引的本质是B+树在数据库中的实现。但是B+树索引有一个特点是高扇出性,因此在数据库中,B+树的高度一般在2到3层。也就是说查找某一键值的记录,最多只需要2到3次IO开销。按磁盘每秒100次IO来计算,查询时间只需0.0.2到0.03秒。 数据库中B+树索引分为聚集索引(clustered index)和非聚集索引(secondary index).这两种索引的共同点...

MySQL order by

1. innodb_sort_buffer_size 在创建InnoDB索引时用于指定对数据排序的排序缓冲区的大小。利用这块内存把数据读进来进行内部排序然后写入磁盘。这个参数只会在创建索引的过程中被使用,不会用在后面的维护操作;在索引创建完毕后innodb_sort_buffer会被释放。 这个值也控制了在执行online DDL期间DML产生的临时日志文件。 默认 1048576...

INSERT IGNORE 与 INSERT INTO的区别

例 insert ignore表示,如果中已经存在相同的记录,则忽略当前新数据; insert ignore into table(name) select name from table2 例 INSERT INTO有无数据都插入,如果主键则不插入 1.insert语句一次可以插入多组值,每组值用一对圆括号括起来,用逗号分隔,如下: insert into `news`(title,bod...

k8s创建pod流程

k8s创建pod流程  kubernetes 创建Pod 的 工作流: step.1 kubectl 向 k8s api server 发起一个create pod 请求(即我们使用Kubectl敲一个create pod命令) 。 step.2 k8s api server接收到pod创建请求后,不会去直接创建pod;而是生成一个包含创建信息的yaml。 step.3 apiserve...