Change encoding to utf-8

This commit is contained in:
Kevin Huang
2022-11-14 17:18:00 +08:00
parent d052f5bd5b
commit 4c3d23ddc6

View File

@@ -1,27 +1,27 @@
# 说明 # 说明
这是用于将markdown格式的设备型号介绍转为csv格式的python脚本。 这是用于将markdown格式的设备型号介绍转为csv格式的python脚本。
输出列:设备编号,设备类型,品牌代码,品牌名,型号编码,型号昵称,型号名称,版本名称 输出列:设备编号,设备类型,品牌代码,品牌名,型号编码,型号昵称,型号名称,版本名称
**设备编号(model)** **设备编号(model)**
能从浏览器UserAgent中获取到的设备编号如华为P40对应"ANA-AL00" 能从浏览器UserAgent中获取到的设备编号如华为P40对应"ANA-AL00"
一个model可能对应多个版本也可能多个model对应一个版本。 一个model可能对应多个版本也可能多个model对应一个版本。
**设备类型(device_type)** **设备类型(device_type)**
包含手机、手表、平板、电视、电视盒子、笔记本、pod等 包含手机、手表、平板、电视、电视盒子、笔记本、pod等
对应csv的值mob,watch,pad,tv,tv_hub,computer,pod 对应csv的值mob,watch,pad,tv,tv_hub,computer,pod
会从一级标题、二级标题、加粗行中尝试提取 会从一级标题、二级标题、加粗行中尝试提取
**品牌代码(brand)** **品牌代码(brand)**
从brands目录下的文件名中提取第一个单词 从brands目录下的文件名中提取第一个单词
**品牌名(brand_title)** **品牌名(brand_title)**
从一级标题中按正则提取 从一级标题中按正则提取
**型号编码(code)** **型号编码(code)**
从加粗行的前面中括号中提取 从加粗行的前面中括号中提取
**型号昵称(code_alias)** **型号昵称(code_alias)**
从加粗行的尾部小括号中提取 从加粗行的尾部小括号中提取
**型号名称(model_name)** **型号名称(model_name)**
从加粗行去掉code和code_alias后剩余的内容 从加粗行去掉code和code_alias后剩余的内容
注意:一行可能有多个型号名称,以"/"分割 注意:一行可能有多个型号名称,以"/"分割
**版本名称(ver_name)** **版本名称(ver_name)**
从model行提取冒号之后的内容再去掉model_name的重合部分只保留版本信息 从model行提取冒号之后的内容再去掉model_name的重合部分只保留版本信息
有些版本名称可能没有完全包含model_name而是只包含其中一部分还有些可能完全没包含model_name 有些版本名称可能没有完全包含model_name而是只包含其中一部分还有些可能完全没包含model_name
输出ver_name中如果包含model_name然后去掉了一部分则规定以"#"开头。 输出ver_name中如果包含model_name然后去掉了一部分则规定以"#"开头。
如果有多个model_name且包含的不是第1个则"#"前面会添加索引 如果有多个model_name且包含的不是第1个则"#"前面会添加索引