dict: 词库调整

This commit is contained in:
amzxyz
2026-01-18 00:00:05 +08:00
parent e3bc798d21
commit bc1f82ac63
4 changed files with 37 additions and 21 deletions

View File

@@ -359,32 +359,42 @@ PC 端用户推荐使用 **Wanxiang Tools (All-in-one)**,内置在线更新器
### 功能一览
#### 辅助码
#### 辅助码系统
辅助码可以在输入一个确定得拼音后面继续输入一个部首读音,使得这个字出现在靠前甚至第一位。这种方式易于理解,无记忆字根,一切基于拼音得基础上。例如:
万象辅助码采用“拼音+部首读音”的自然逻辑,无记忆字根,在双拼/全拼基础上直接追加部首声母即可筛选。
![截图_选择区域_20240704121653.png](https://storage.deepin.org/thread/202407041144502563_截图_选择区域_20240704121653.png)
**直接辅助码** **仅PRO** 如果想要 `` 字显示在前面 那么在本方案下提供两种方式,第一种就是辅助码声母,`vf`继续输入`j` 也就是金字旁得声母即可出现结果,如果还是出现不了你要的结果,可以输入另外主体字的声母来继续缩小范围。
**1. 直接辅助码 (仅 PRO 版)**
* **基本用法**:输入双拼后直接追加部首声母。
* *示例*:输入“镇”字,双拼 `vf` + 金字旁声母 `j` → `vfj`。
* *进阶*:若未出现,可继续输入主体部件的声母进一步筛选。
![截图_选择区域_20240704121809.png](https://storage.deepin.org/thread/202407041147131421_截图_选择区域_20240704121809.png)
句子中间或者单字输入时需要输入全位辅助码时由于与双拼词语重码因为我们设计的基本辅助码是2位加上双拼共4位由于在整句中我们为了整句输入的顺畅不会将4码聚拢作为优先级较高的选择这样会在很多时候造成你想打的句子缩成一团变成全辅助码的词汇。此时可以通过追加/的方式使其聚拢,这种方式是由于我们是直接辅助码导致的,如果我们通过一个符号引导辅助码,那么在输入时要每一个都用到符号,而采用这种方式我们只需要在必要的时候使用/节省了输入的按键开支,下面由两个图片说明问题:
* **重码处理与聚拢**:当“双拼+辅码”与现有词组重码时均为4码系统优先显示词组以保证整句流畅。此时在编码末尾追加 `/`,即可强制系统忽略词组,优先展示带辅码的单字。
![截图_选择区域_20240821093644.png](https://storage.deepin.org/thread/202408210142513354_截图_选择区域_20240821093644.png)
![截图_选择区域_20240821093701.png](https://storage.deepin.org/thread/202408210143144721_截图_选择区域_20240821093701.png)
**间接辅助码** **仅PRO** 除以上直接使用辅助外,我们还支持中间加入/来引导辅助码的输入,即:功能1是"nire/" 在有需求的时候末尾增加斜杠能让系统侧重于单字,平时则永远在动态切分,这个模式也是比较吃词库的,当你的词组完整,遇到的异常就少,当词组不完整,你想输入三个字2+2+2编码结构,恰好辅助码与双拼编码重合就会出现3+3的聚拢,此时将你想输入的三个字放入词库中,这个问题就得到了解决,还有得项目通过Lua重新切分来解决,看似巧妙,实际上比较吃操作,影响节奏,无疑万象在很多选择上面选择了更加难的路线,用词库的全面性来托举.
而在功能2中是"ni/re",也就是说辅助码必须经过/来引导,如果你不输入/它将与普通双拼无异,优点是类似vsg能够派生出"中国",更适用于新手辅助码或者叫辅助码轻量使用者.
**2. 间接辅助码 (仅 PRO 版)**
**输入后反查筛选** 通过反查字库来定位词组或者单字,只能为已有词组,不能为词组+词组组成的句子。在输入主要拼音后,通过符号``` ` ``` 来引导进入反查状态,引导后继续输入`jn`金 则包含金的字就会被选出来,也可以为`j`也就是首字母;
* **基本用法**:使用 `/` 作为分隔符引导辅助码(格式:`拼音/辅码`)。
* *示例*`ni/re`。
* **特性**:若不输入 `/`,系统将其视为普通拼音,绝不干扰整句切分。相比直接辅助码,此模式更适合新手或轻量级用户,无需担心重码干扰节奏。
**3. 候选筛选 (输入后反查)**
针对当前输入的候选词,可通过引导符 ``` ` ``` (Tab上方的键) 进行二次筛选:
* **操作**:输入主拼音 -> 按 ``` ` ``` -> 输入部首读音首字母。
* **示例**:输入拼音后,按 ``` ` ``` 再按 `j` (jin) 筛选金字旁;按 `mu` (mu) 筛选木字旁。
![截图_选择区域_20240704121635.png](https://storage.deepin.org/thread/202407041149125588_截图_选择区域_20240704121635.png)
引导后继续输入`mu 木`则带``的字就会被选出来
![截图_选择区域_20240704121611.png](https://storage.deepin.org/thread/202407041149524870_截图_选择区域_20240704121611.png)
![截图_选择区域_20240704121611.png](https://storage.deepin.org/thread/202407041149524870_截图_选择区域_20240704121611.png)
对于单字:实际上我们同时支持,```两分:你(ni`rferni`re)、多分mu`ckrida、笔画你ni`pspzhpd```
对于词组,假设 **“老实说”** 的辅助码序列构造为:`tb` (老) + `gt` (实) + `yd` (说) = **`tbgtyd`**
@@ -398,6 +408,10 @@ PC 端用户推荐使用 **Wanxiang Tools (All-in-one)**,内置在线更新器
只要你的输入符合 **`.*t.*b.*g.*t.*y.*d.*`** 的正则逻辑,都能精准命中!
**声调反查支持** 我们还支持在反查符号后面任意位置按顺序输入数字声调7890,单字只有第一个输入的数字生效,词组,按字数生效
**例如** 单字ni\`r9e、ni\`rf9er 词组nihk\`n9zr9e 为了用户方便声调可随意插入,程序会提取数字应用声调过滤,并将剩余字母编码组成按上面提到的逻辑执行
对于pro版本还可以设置词库中携带的辅助码用于反查这就类似间接辅助码的功能了但不同的是间接辅助能够句中任意而反查只能作用于词库中已有的词组。
注意刻意设计**词组匹配不支持笔画**这也是为了规避复杂度
@@ -409,8 +423,8 @@ wanxiang_lookup:
tags: [ abc ] # 生效的 tag
key: "`" # 反查引导符 (建议使用默认,避免与分词符 ' 冲突)
lookup: [ wanxiang_reverse ] # 反查数据库
data_source: [ comment, db ] # 【核心】数据源优先级:写在前面的优先!
# comment: 从词库注释(辅助码)提取
data_source: [ aux, db ] # 【核心】数据源优先级:写在前面的优先!
# aux: 从词库注释(辅助码)提取
# db: 从反查数据库(拆字/五笔画等)提取
```
反查、笔画都必须wanxiang_reverse.custom配置默认全拼加大写五笔画你可以根据自己习惯定制五笔画对应的编码转写反查则切换为对应的双拼全拼这个文件与主方案类似都是在根用户目录生效打开就明白了。
@@ -594,9 +608,9 @@ datetime_formats:
化学式:<img src="https://storage.deepin.org/thread/202509260128462735_tips化学式.jpg" height="80">符号:<img src="https://storage.deepin.org/thread/202509260128454675_tips符号.jpg" height="80">表情:<img src="https://storage.deepin.org/thread/202509260128457494_tips表情.jpg" height="80">
**首选格式化Lua** 将自定义短语中,诸如\n \s \t 等行中标识符转换为实际的换行、空格、制表符等等使得类似输入jys可以打出一首带格式的《静夜思》这将成为类似书名号输入场景的利器
**首选格式化Lua** 将首页自定义短语中custom phrase,诸如\n \s \t 等行中标识符转换为实际的换行、空格、制表符等等,支持重复字符声明,使得类似输入jys可以打出一首带格式的《静夜思》使用{3}大括号+数字的形式表示前面的字符重复N次
例:```静夜思\n\s\s李白\n床前明月光\n疑似地上霜\n举头望明月\n低头思故乡 jys```
例:```静夜思\n\s{3}李白\n床前明月光\n疑似地上霜\n举头望明月\n低头思故乡 jys```
<img src="https://storage.deepin.org/thread/202509260129305342_格式化.jpg" height="260">

View File

@@ -58159,7 +58159,7 @@ siren siren
sirenian sirenian
sirens sirens
sires sires
siri siri
Siri Siri
Sirius Sirius
sirloin sirloin
sirocco sirocco

View File

@@ -306288,6 +306288,7 @@ sort: by_weight
儿时代 ér shí dài 137
二十石 èr shí dàn 107
二十担 èr shí dān 56
二十到 èr shí dào 320
二十道 èr shí dào 120
儿时的 ér shí de 289
二十的 èr shí de 207
@@ -306408,7 +306409,6 @@ sort: by_weight
而实现 ér shí xiàn 242
而是想 ér shì xiǎng 240
二十项 èr shí xiàng 190
二实小 èr shí xiǎo 182
二十小 èr shí xiǎo 60
二师兄 èr shī xiōng 238
二十穴 èr shí xué 69
@@ -587592,7 +587592,7 @@ sort: by_weight
三十大 sān shí dà 102
三式弹 sān shì dàn 105
三十石 sān shí dàn 88
散失到 sàn shī dào 95
三十到 sān shí dào 150
三十道 sān shí dào 50
三室的 sān shì de 138
三十的 sān shí de 125
@@ -712323,6 +712323,7 @@ sort: by_weight
五十石 wǔ shí dàn 126
武士道 wǔ shì dào 296
武士刀 wǔ shì dāo 292
五十到 wǔ shí dào 192
五十道 wǔ shí dào 168
无视的 wú shì de 205
无事的 wú shì de 167
@@ -1114958,8 +1114959,8 @@ sort: by_weight
就像以前 jiù xiàng yǐ qián 76
就响一声 jiù xiǎng yì shēng 5
就想与你 jiù xiǎng yǔ nǐ 1
这样 jiù xiǎng zhè yàng 86
这样 jiù xiàng zhè yàng 59
这样 jiù xiàng zhè yàng 86
这样 jiù xiǎng zhè yàng 59
就像征服 jiù xiàng zhēng fú 40
就像种树 jiù xiàng zhòng shù 17
九小场所 jiǔ xiǎo chǎng suǒ 57
@@ -1300375,6 +1300376,7 @@ sort: by_weight
石亦歌咏 shí yì gē yǒng 7
是一个月 shì yí gè yuè 95
十一个月 shí yī gè yuè 76
是一个组 shì yí gè zǔ 17
师逸功倍 shī yì gōng bèi 5
十一工段 shí yī gōng duàn 1
十一公里 shí yī gōng lǐ 30

View File

@@ -3101,5 +3101,5 @@ english:
#特殊优化:部分音节字极少,几乎不参与构词,则提升对应四码字的优先级,仅对自然码有效,其他双拼方案需作对应修改)
自然码提权:
__append:
- derive/^(.*?)(\d?);(jb|wq|aq|av|dn|xh|bv|jz|hm|sn|cd|iw|xl|ak|zy|fy|uz|yx|wb|wr|yw|dz|qz|ms|at|xf|gi|gn|or|ux|ww|nw|fs|qk|rl|cq|sw|jv|cy|sq|dd|fp|ae|ix|td|ep|ar|wm|pd|et|yz|eh|ct|os|hx|zq|ew|fm|ab|kc|tf|fx|we|sz|wx|bq|ic|ez|bs|ej|oh|ps|pw|fr|pq|au|wc|wp|dt|qf|zc|vx|im|br|mw|un|qb|fi|zm|vn|oz|kt|rq|ay|fn|yc|um|eq|eu|cz|yq|tq|oi|ek|az|fv|zx|ut|vz|ry|ac|ws|af|qv|ea|qj|al|ol|on|sx|ap|df|eg|rz|ey|em|ag|hi|iz|ki|xz|xj|ad|ft|pt|op|vt|oj|kn|pr|hq|eb|ev|cx|zd|am|ov|oq|ym|ef|ot|mr|rd|sy|oc|rc|oe|fq|cn|ok|rn|bp|yv|uc|wk|oy|bt|je|ow|xg|jj|rw|pp|ja|wt|lf|xe|wy|kx|sm|qe|fw|gc|xa|cw|zn|tn|cc|jo|md|sd|ql|kq|it|bd|sc|wv|fc|dw|ob|vm|ed|jl|xo|fl|gq|gt|of|pv|wd|qa|xk|yd|fe|og|iq|oa|uq|om|xv|mv|as|ox|km|zt|od|ht|el|hn|st|wn|mt|wi|tz|aj|yg|bw|jf|jg|kz|es|xb|ax|rt|gx|bb|qo|yf|ex|rx|tt|us|qg|pe|zw|mp|qh|rm|hc|np|jh|cm|yl|eo|ra|vc|aw|tw|fk|gm|ec|be|vq|fd|jk|in)$/$1$3/
- derive/^(.*?)(\d?);.*?,(jb|wq|aq|av|dn|xh|bv|jz|hm|sn|cd|iw|xl|ak|zy|fy|uz|yx|wb|wr|yw|dz|qz|ms|at|xf|gi|gn|or|ux|ww|nw|fs|qk|rl|cq|sw|jv|cy|sq|dd|fp|ae|ix|td|ep|ar|wm|pd|et|yz|eh|ct|os|hx|zq|ew|fm|ab|kc|tf|fx|we|sz|wx|bq|ic|ez|bs|ej|oh|ps|pw|fr|pq|au|wc|wp|dt|qf|zc|vx|im|br|mw|un|qb|fi|zm|vn|oz|kt|rq|ay|fn|yc|um|eq|eu|cz|yq|tq|oi|ek|az|fv|zx|ut|vz|ry|ac|ws|af|qv|ea|qj|al|ol|on|sx|ap|df|eg|rz|ey|em|ag|hi|iz|ki|xz|xj|ad|ft|pt|op|vt|oj|kn|pr|hq|eb|ev|cx|zd|am|ov|oq|ym|ef|ot|mr|rd|sy|oc|rc|oe|fq|cn|ok|rn|bp|yv|uc|wk|oy|bt|je|ow|xg|jj|rw|pp|ja|wt|lf|xe|wy|kx|sm|qe|fw|gc|xa|cw|zn|tn|cc|jo|md|sd|ql|kq|it|bd|sc|wv|fc|dw|ob|vm|ed|jl|xo|fl|gq|gt|of|pv|wd|qa|xk|yd|fe|og|iq|oa|uq|om|xv|mv|as|ox|km|zt|od|ht|el|hn|st|wn|mt|wi|tz|aj|yg|bw|jf|jg|kz|es|xb|ax|rt|gx|bb|qo|yf|ex|rx|tt|us|qg|pe|zw|mp|qh|rm|hc|np|jh|cm|yl|eo|ra|vc|aw|tw|fk|gm|ec|be|vq|fd|jk|in)$/$1$3/
- derive/^(.*?)(\d?);(jb|wq|aq|av|dn|xh|bv|jz|hm|sn|cd|iw|xl|ak|zy|fy|uz|yx|wb|wr|yw|qz|ms|at|xf|gi|gn|or|ux|ww|nw|fs|qk|rl|cq|sw|jv|cy|sq|dd|fp|ae|ix|td|ep|ar|wm|pd|et|yz|eh|ct|os|hx|zq|ew|fm|ab|kc|tf|fx|we|sz|wx|bq|ic|ez|bs|ej|oh|ps|pw|fr|pq|au|wc|wp|dt|qf|zc|vx|im|br|mw|un|qb|fi|zm|vn|oz|kt|rq|ay|fn|yc|um|eq|eu|cz|yq|tq|oi|ek|az|fv|zx|ut|vz|ry|ac|ws|af|qv|ea|qj|al|ol|on|sx|ap|df|eg|rz|ey|em|ag|hi|iz|ki|xz|xj|ad|ft|pt|op|vt|oj|kn|pr|hq|eb|ev|cx|zd|am|ov|oq|ym|ef|ot|mr|rd|sy|oc|rc|oe|fq|cn|ok|rn|bp|yv|uc|wk|oy|bt|je|ow|xg|jj|rw|pp|ja|wt|lf|xe|wy|kx|sm|qe|fw|gc|xa|cw|zn|tn|cc|jo|md|sd|ql|kq|it|bd|sc|wv|fc|dw|ob|vm|ed|jl|xo|fl|gq|gt|of|pv|wd|qa|xk|yd|fe|og|iq|oa|uq|om|xv|mv|as|ox|km|zt|od|ht|el|hn|st|wn|mt|wi|tz|aj|yg|bw|jf|jg|kz|es|xb|ax|rt|gx|bb|qo|yf|ex|rx|tt|us|qg|pe|zw|mp|qh|rm|hc|np|jh|cm|yl|eo|ra|vc|aw|tw|fk|gm|ec|be|vq|fd|jk|in)$/$1$3/
- derive/^(.*?)(\d?);.*?,(jb|wq|aq|av|dn|xh|bv|jz|hm|sn|cd|iw|xl|ak|zy|fy|uz|yx|wb|wr|yw|qz|ms|at|xf|gi|gn|or|ux|ww|nw|fs|qk|rl|cq|sw|jv|cy|sq|dd|fp|ae|ix|td|ep|ar|wm|pd|et|yz|eh|ct|os|hx|zq|ew|fm|ab|kc|tf|fx|we|sz|wx|bq|ic|ez|bs|ej|oh|ps|pw|fr|pq|au|wc|wp|dt|qf|zc|vx|im|br|mw|un|qb|fi|zm|vn|oz|kt|rq|ay|fn|yc|um|eq|eu|cz|yq|tq|oi|ek|az|fv|zx|ut|vz|ry|ac|ws|af|qv|ea|qj|al|ol|on|sx|ap|df|eg|rz|ey|em|ag|hi|iz|ki|xz|xj|ad|ft|pt|op|vt|oj|kn|pr|hq|eb|ev|cx|zd|am|ov|oq|ym|ef|ot|mr|rd|sy|oc|rc|oe|fq|cn|ok|rn|bp|yv|uc|wk|oy|bt|je|ow|xg|jj|rw|pp|ja|wt|lf|xe|wy|kx|sm|qe|fw|gc|xa|cw|zn|tn|cc|jo|md|sd|ql|kq|it|bd|sc|wv|fc|dw|ob|vm|ed|jl|xo|fl|gq|gt|of|pv|wd|qa|xk|yd|fe|og|iq|oa|uq|om|xv|mv|as|ox|km|zt|od|ht|el|hn|st|wn|mt|wi|tz|aj|yg|bw|jf|jg|kz|es|xb|ax|rt|gx|bb|qo|yf|ex|rx|tt|us|qg|pe|zw|mp|qh|rm|hc|np|jh|cm|yl|eo|ra|vc|aw|tw|fk|gm|ec|be|vq|fd|jk|in)$/$1$3/