Files
MobileModels/scripts
2024-02-06 23:06:21 +08:00
..
2023-08-30 22:48:02 +08:00
2024-02-06 23:06:21 +08:00
2023-02-20 16:24:15 +08:00

说明

这是用于将markdown格式的设备型号介绍转为csv格式的python脚本。
输出列:设备编号,设备类型,品牌代码,品牌名,型号编码,型号昵称,型号名称,版本名称

设备编号(model)
能从浏览器UserAgent中获取到的设备编号如华为P40对应"ANA-AL00"
一个model可能对应多个版本也可能多个model对应一个版本。
设备类型(device_type)
包含手机、手表、平板、电视、电视盒子、笔记本、pod等
对应csv的值mob,watch,pad,tv,tv_hub,computer,pod
会从一级标题、二级标题、加粗行中尝试提取。如果一级标题不存在则置为空,如果有多个二级标题,后面的二级标题(或加粗行)未检测到有效设备类型,会使用前面的设备类型。
品牌代码(brand)
从brands目录下的文件名中提取第一个单词
品牌名(brand_title)
从一级标题中按正则提取
型号编码(code)
从加粗行的前面中括号中提取
型号昵称(code_alias)
从加粗行的尾部小括号中提取
型号名称(model_name)
从加粗行去掉code和code_alias后剩余的内容
注意:一行可能有多个型号名称,以"/"分割
版本名称(ver_name)
从model行提取冒号之后的内容再去掉model_name的重合部分只保留版本信息
有些版本名称可能没有完全包含model_name而是只包含其中一部分还有些可能完全没包含model_name
输出ver_name中如果包含model_name然后去掉了一部分则规定以"#"开头。
如果有多个model_name且包含的不是第1个则"#"前面会添加索引 例如"CPH2413"对应"一加 10T 印度版",但所属的型号是"一加 Ace Pro / 一加 10T",有两个,和第二个型号相同,所以版本中去掉相同的"一加 10T"部分,变成"#印度版"又因为对应的型号是第二个索引是1故最后是"1#印度版"