mirror of
https://github.com/d0zingcat/rime_wanxiang.git
synced 2026-05-22 23:26:45 +00:00
dict: 词库调整
This commit is contained in:
42
README.md
42
README.md
@@ -359,32 +359,42 @@ PC 端用户推荐使用 **Wanxiang Tools (All-in-one)**,内置在线更新器
|
||||
|
||||
### 功能一览
|
||||
|
||||
#### 辅助码
|
||||
#### 辅助码系统
|
||||
|
||||
辅助码可以在输入一个确定得拼音后面继续输入一个部首的读音,使得这个字出现在靠前甚至第一位。这种方式易于理解,无须记忆字根,一切基于拼音得基础上。例如:
|
||||
万象辅助码采用“拼音+部首读音”的自然逻辑,无需记忆字根,在双拼/全拼基础上直接追加部首声母即可筛选。
|
||||
|
||||

|
||||
|
||||
**直接辅助码** **(仅PRO)** 如果想要 `镇` 字显示在前面 那么在本方案下提供两种方式,第一种就是辅助码声母,`vf`继续输入`j` 也就是金字旁得声母即可出现结果,如果还是出现不了你要的结果,可以输入另外主体字的声母来继续缩小范围。
|
||||
**1. 直接辅助码 (仅 PRO 版)**
|
||||
|
||||
* **基本用法**:输入双拼后直接追加部首声母。
|
||||
* *示例*:输入“镇”字,双拼 `vf` + 金字旁声母 `j` → `vfj`。
|
||||
* *进阶*:若未出现,可继续输入主体部件的声母进一步筛选。
|
||||
|
||||

|
||||
|
||||
句子中间或者单字输入时需要输入全位辅助码时由于与双拼词语重码,因为我们设计的基本辅助码是2位,加上双拼共4位,由于在整句中我们为了整句输入的顺畅,不会将4码聚拢作为优先级较高的选择,这样会在很多时候造成你想打的句子缩成一团变成全辅助码的词汇。此时可以通过追加/的方式使其聚拢,这种方式是由于我们是直接辅助码导致的,如果我们通过一个符号引导辅助码,那么在输入时要每一个都用到符号,而采用这种方式我们只需要在必要的时候使用/节省了输入的按键开支,下面由两个图片说明问题:
|
||||
* **重码处理与聚拢**:当“双拼+辅码”与现有词组重码时(均为4码),系统优先显示词组以保证整句流畅。此时在编码末尾追加 `/`,即可强制系统忽略词组,优先展示带辅码的单字。
|
||||
|
||||

|
||||
|
||||

|
||||
|
||||
**间接辅助码** **(仅PRO)** 除以上直接使用辅助外,我们还支持中间加入/来引导辅助码的输入,即:功能1是"nire/" 在有需求的时候末尾增加斜杠能让系统侧重于单字,平时则永远在动态切分,这个模式也是比较吃词库的,当你的词组完整,遇到的异常就少,当词组不完整,你想输入三个字2+2+2编码结构,恰好辅助码与双拼编码重合就会出现3+3的聚拢,此时将你想输入的三个字放入词库中,这个问题就得到了解决,还有得项目通过Lua重新切分来解决,看似巧妙,实际上比较吃操作,影响节奏,无疑万象在很多选择上面选择了更加难的路线,用词库的全面性来托举.
|
||||
而在功能2中是"ni/re",也就是说辅助码必须经过/来引导,如果你不输入/它将与普通双拼无异,优点是类似vsg能够派生出"中国",更适用于新手辅助码或者叫辅助码轻量使用者.
|
||||
**2. 间接辅助码 (仅 PRO 版)**
|
||||
|
||||
**输入后反查筛选** 通过反查字库来定位词组或者单字,只能为已有词组,不能为词组+词组组成的句子。在输入主要拼音后,通过符号``` ` ``` 来引导进入反查状态,引导后继续输入`jn`金 则包含金的字就会被选出来,也可以为`j`也就是首字母;
|
||||
* **基本用法**:使用 `/` 作为分隔符引导辅助码(格式:`拼音/辅码`)。
|
||||
* *示例*:`ni/re`。
|
||||
* **特性**:若不输入 `/`,系统将其视为普通拼音,绝不干扰整句切分。相比直接辅助码,此模式更适合新手或轻量级用户,无需担心重码干扰节奏。
|
||||
|
||||
**3. 候选筛选 (输入后反查)**
|
||||
|
||||
针对当前输入的候选词,可通过引导符 ``` ` ``` (Tab上方的键) 进行二次筛选:
|
||||
|
||||
* **操作**:输入主拼音 -> 按 ``` ` ``` -> 输入部首读音首字母。
|
||||
* **示例**:输入拼音后,按 ``` ` ``` 再按 `j` (jin) 筛选金字旁;按 `mu` (mu) 筛选木字旁。
|
||||
|
||||

|
||||
|
||||
引导后继续输入`mu 木`则带`木`的字就会被选出来
|
||||
|
||||

|
||||

|
||||
|
||||
对于单字:实际上我们同时支持,```两分:你(ni`rfer,ni`re)、多分:莫(mu`ckrida)、笔画:你ni`pspzhpd```
|
||||
对于词组,假设 **“老实说”** 的辅助码序列构造为:`tb` (老) + `gt` (实) + `yd` (说) = **`tbgtyd`**
|
||||
@@ -398,6 +408,10 @@ PC 端用户推荐使用 **Wanxiang Tools (All-in-one)**,内置在线更新器
|
||||
|
||||
只要你的输入符合 **`.*t.*b.*g.*t.*y.*d.*`** 的正则逻辑,都能精准命中!
|
||||
|
||||
**声调反查支持** 我们还支持在反查符号后面任意位置按顺序输入数字声调7890,单字只有第一个输入的数字生效,词组,按字数生效
|
||||
|
||||
**例如** 单字:ni\`r9e、ni\`rf9er 词组:nihk\`n9zr9e 为了用户方便声调可随意插入,程序会提取数字应用声调过滤,并将剩余字母编码组成按上面提到的逻辑执行
|
||||
|
||||
对于pro版本还可以设置词库中携带的辅助码用于反查,这就类似间接辅助码的功能了,但不同的是间接辅助能够句中任意,而反查只能作用于词库中已有的词组。
|
||||
|
||||
注意刻意设计**词组匹配不支持笔画**这也是为了规避复杂度
|
||||
@@ -409,8 +423,8 @@ wanxiang_lookup:
|
||||
tags: [ abc ] # 生效的 tag
|
||||
key: "`" # 反查引导符 (建议使用默认,避免与分词符 ' 冲突)
|
||||
lookup: [ wanxiang_reverse ] # 反查数据库
|
||||
data_source: [ comment, db ] # 【核心】数据源优先级:写在前面的优先!
|
||||
# comment: 从词库注释(辅助码)提取
|
||||
data_source: [ aux, db ] # 【核心】数据源优先级:写在前面的优先!
|
||||
# aux: 从词库注释(辅助码)提取
|
||||
# db: 从反查数据库(拆字/五笔画等)提取
|
||||
```
|
||||
反查、笔画都必须wanxiang_reverse.custom配置,默认全拼加大写五笔画,你可以根据自己习惯定制五笔画对应的编码转写,反查则切换为对应的双拼全拼,这个文件与主方案类似,都是在根用户目录生效,打开就明白了。
|
||||
@@ -594,9 +608,9 @@ datetime_formats:
|
||||
|
||||
化学式:<img src="https://storage.deepin.org/thread/202509260128462735_tips化学式.jpg" height="80">符号:<img src="https://storage.deepin.org/thread/202509260128454675_tips符号.jpg" height="80">表情:<img src="https://storage.deepin.org/thread/202509260128457494_tips表情.jpg" height="80">
|
||||
|
||||
**首选格式化Lua:** 将自定义短语中,诸如\n \s \t 等行中标识符转换为实际的换行、空格、制表符等等,使得类似输入jys可以打出一首带格式的《静夜思》,这将成为类似书名号输入场景的利器。
|
||||
**首选格式化Lua:** 将首页自定义短语中(custom phrase),诸如\n \s \t 等行中标识符转换为实际的换行、空格、制表符等等,支持重复字符声明,使得类似输入jys可以打出一首带格式的《静夜思》,使用{3}大括号+数字的形式表示前面的字符重复N次。
|
||||
|
||||
例:```静夜思\n\s\s李白\n床前明月光\n疑似地上霜\n举头望明月\n低头思故乡 jys```
|
||||
例:```静夜思\n\s{3}李白\n床前明月光\n疑似地上霜\n举头望明月\n低头思故乡 jys```
|
||||
|
||||
<img src="https://storage.deepin.org/thread/202509260129305342_格式化.jpg" height="260">
|
||||
|
||||
|
||||
@@ -58159,7 +58159,7 @@ siren siren
|
||||
sirenian sirenian
|
||||
sirens sirens
|
||||
sires sires
|
||||
siri siri
|
||||
Siri Siri
|
||||
Sirius Sirius
|
||||
sirloin sirloin
|
||||
sirocco sirocco
|
||||
|
||||
@@ -306288,6 +306288,7 @@ sort: by_weight
|
||||
儿时代 ér shí dài 137
|
||||
二十石 èr shí dàn 107
|
||||
二十担 èr shí dān 56
|
||||
二十到 èr shí dào 320
|
||||
二十道 èr shí dào 120
|
||||
儿时的 ér shí de 289
|
||||
二十的 èr shí de 207
|
||||
@@ -306408,7 +306409,6 @@ sort: by_weight
|
||||
而实现 ér shí xiàn 242
|
||||
而是想 ér shì xiǎng 240
|
||||
二十项 èr shí xiàng 190
|
||||
二实小 èr shí xiǎo 182
|
||||
二十小 èr shí xiǎo 60
|
||||
二师兄 èr shī xiōng 238
|
||||
二十穴 èr shí xué 69
|
||||
@@ -587592,7 +587592,7 @@ sort: by_weight
|
||||
三十大 sān shí dà 102
|
||||
三式弹 sān shì dàn 105
|
||||
三十石 sān shí dàn 88
|
||||
散失到 sàn shī dào 95
|
||||
三十到 sān shí dào 150
|
||||
三十道 sān shí dào 50
|
||||
三室的 sān shì de 138
|
||||
三十的 sān shí de 125
|
||||
@@ -712323,6 +712323,7 @@ sort: by_weight
|
||||
五十石 wǔ shí dàn 126
|
||||
武士道 wǔ shì dào 296
|
||||
武士刀 wǔ shì dāo 292
|
||||
五十到 wǔ shí dào 192
|
||||
五十道 wǔ shí dào 168
|
||||
无视的 wú shì de 205
|
||||
无事的 wú shì de 167
|
||||
@@ -1114958,8 +1114959,8 @@ sort: by_weight
|
||||
就像以前 jiù xiàng yǐ qián 76
|
||||
就响一声 jiù xiǎng yì shēng 5
|
||||
就想与你 jiù xiǎng yǔ nǐ 1
|
||||
就想这样 jiù xiǎng zhè yàng 86
|
||||
就像这样 jiù xiàng zhè yàng 59
|
||||
就像这样 jiù xiàng zhè yàng 86
|
||||
就想这样 jiù xiǎng zhè yàng 59
|
||||
就像征服 jiù xiàng zhēng fú 40
|
||||
就像种树 jiù xiàng zhòng shù 17
|
||||
九小场所 jiǔ xiǎo chǎng suǒ 57
|
||||
@@ -1300375,6 +1300376,7 @@ sort: by_weight
|
||||
石亦歌咏 shí yì gē yǒng 7
|
||||
是一个月 shì yí gè yuè 95
|
||||
十一个月 shí yī gè yuè 76
|
||||
是一个组 shì yí gè zǔ 17
|
||||
师逸功倍 shī yì gōng bèi 5
|
||||
十一工段 shí yī gōng duàn 1
|
||||
十一公里 shí yī gōng lǐ 30
|
||||
|
||||
@@ -3101,5 +3101,5 @@ english:
|
||||
#特殊优化:部分音节字极少,几乎不参与构词,则提升对应四码字的优先级,仅对自然码有效,其他双拼方案需作对应修改)
|
||||
自然码提权:
|
||||
__append:
|
||||
- derive/^(.*?)(\d?);(jb|wq|aq|av|dn|xh|bv|jz|hm|sn|cd|iw|xl|ak|zy|fy|uz|yx|wb|wr|yw|dz|qz|ms|at|xf|gi|gn|or|ux|ww|nw|fs|qk|rl|cq|sw|jv|cy|sq|dd|fp|ae|ix|td|ep|ar|wm|pd|et|yz|eh|ct|os|hx|zq|ew|fm|ab|kc|tf|fx|we|sz|wx|bq|ic|ez|bs|ej|oh|ps|pw|fr|pq|au|wc|wp|dt|qf|zc|vx|im|br|mw|un|qb|fi|zm|vn|oz|kt|rq|ay|fn|yc|um|eq|eu|cz|yq|tq|oi|ek|az|fv|zx|ut|vz|ry|ac|ws|af|qv|ea|qj|al|ol|on|sx|ap|df|eg|rz|ey|em|ag|hi|iz|ki|xz|xj|ad|ft|pt|op|vt|oj|kn|pr|hq|eb|ev|cx|zd|am|ov|oq|ym|ef|ot|mr|rd|sy|oc|rc|oe|fq|cn|ok|rn|bp|yv|uc|wk|oy|bt|je|ow|xg|jj|rw|pp|ja|wt|lf|xe|wy|kx|sm|qe|fw|gc|xa|cw|zn|tn|cc|jo|md|sd|ql|kq|it|bd|sc|wv|fc|dw|ob|vm|ed|jl|xo|fl|gq|gt|of|pv|wd|qa|xk|yd|fe|og|iq|oa|uq|om|xv|mv|as|ox|km|zt|od|ht|el|hn|st|wn|mt|wi|tz|aj|yg|bw|jf|jg|kz|es|xb|ax|rt|gx|bb|qo|yf|ex|rx|tt|us|qg|pe|zw|mp|qh|rm|hc|np|jh|cm|yl|eo|ra|vc|aw|tw|fk|gm|ec|be|vq|fd|jk|in)$/$1$3/
|
||||
- derive/^(.*?)(\d?);.*?,(jb|wq|aq|av|dn|xh|bv|jz|hm|sn|cd|iw|xl|ak|zy|fy|uz|yx|wb|wr|yw|dz|qz|ms|at|xf|gi|gn|or|ux|ww|nw|fs|qk|rl|cq|sw|jv|cy|sq|dd|fp|ae|ix|td|ep|ar|wm|pd|et|yz|eh|ct|os|hx|zq|ew|fm|ab|kc|tf|fx|we|sz|wx|bq|ic|ez|bs|ej|oh|ps|pw|fr|pq|au|wc|wp|dt|qf|zc|vx|im|br|mw|un|qb|fi|zm|vn|oz|kt|rq|ay|fn|yc|um|eq|eu|cz|yq|tq|oi|ek|az|fv|zx|ut|vz|ry|ac|ws|af|qv|ea|qj|al|ol|on|sx|ap|df|eg|rz|ey|em|ag|hi|iz|ki|xz|xj|ad|ft|pt|op|vt|oj|kn|pr|hq|eb|ev|cx|zd|am|ov|oq|ym|ef|ot|mr|rd|sy|oc|rc|oe|fq|cn|ok|rn|bp|yv|uc|wk|oy|bt|je|ow|xg|jj|rw|pp|ja|wt|lf|xe|wy|kx|sm|qe|fw|gc|xa|cw|zn|tn|cc|jo|md|sd|ql|kq|it|bd|sc|wv|fc|dw|ob|vm|ed|jl|xo|fl|gq|gt|of|pv|wd|qa|xk|yd|fe|og|iq|oa|uq|om|xv|mv|as|ox|km|zt|od|ht|el|hn|st|wn|mt|wi|tz|aj|yg|bw|jf|jg|kz|es|xb|ax|rt|gx|bb|qo|yf|ex|rx|tt|us|qg|pe|zw|mp|qh|rm|hc|np|jh|cm|yl|eo|ra|vc|aw|tw|fk|gm|ec|be|vq|fd|jk|in)$/$1$3/
|
||||
- derive/^(.*?)(\d?);(jb|wq|aq|av|dn|xh|bv|jz|hm|sn|cd|iw|xl|ak|zy|fy|uz|yx|wb|wr|yw|qz|ms|at|xf|gi|gn|or|ux|ww|nw|fs|qk|rl|cq|sw|jv|cy|sq|dd|fp|ae|ix|td|ep|ar|wm|pd|et|yz|eh|ct|os|hx|zq|ew|fm|ab|kc|tf|fx|we|sz|wx|bq|ic|ez|bs|ej|oh|ps|pw|fr|pq|au|wc|wp|dt|qf|zc|vx|im|br|mw|un|qb|fi|zm|vn|oz|kt|rq|ay|fn|yc|um|eq|eu|cz|yq|tq|oi|ek|az|fv|zx|ut|vz|ry|ac|ws|af|qv|ea|qj|al|ol|on|sx|ap|df|eg|rz|ey|em|ag|hi|iz|ki|xz|xj|ad|ft|pt|op|vt|oj|kn|pr|hq|eb|ev|cx|zd|am|ov|oq|ym|ef|ot|mr|rd|sy|oc|rc|oe|fq|cn|ok|rn|bp|yv|uc|wk|oy|bt|je|ow|xg|jj|rw|pp|ja|wt|lf|xe|wy|kx|sm|qe|fw|gc|xa|cw|zn|tn|cc|jo|md|sd|ql|kq|it|bd|sc|wv|fc|dw|ob|vm|ed|jl|xo|fl|gq|gt|of|pv|wd|qa|xk|yd|fe|og|iq|oa|uq|om|xv|mv|as|ox|km|zt|od|ht|el|hn|st|wn|mt|wi|tz|aj|yg|bw|jf|jg|kz|es|xb|ax|rt|gx|bb|qo|yf|ex|rx|tt|us|qg|pe|zw|mp|qh|rm|hc|np|jh|cm|yl|eo|ra|vc|aw|tw|fk|gm|ec|be|vq|fd|jk|in)$/$1$3/
|
||||
- derive/^(.*?)(\d?);.*?,(jb|wq|aq|av|dn|xh|bv|jz|hm|sn|cd|iw|xl|ak|zy|fy|uz|yx|wb|wr|yw|qz|ms|at|xf|gi|gn|or|ux|ww|nw|fs|qk|rl|cq|sw|jv|cy|sq|dd|fp|ae|ix|td|ep|ar|wm|pd|et|yz|eh|ct|os|hx|zq|ew|fm|ab|kc|tf|fx|we|sz|wx|bq|ic|ez|bs|ej|oh|ps|pw|fr|pq|au|wc|wp|dt|qf|zc|vx|im|br|mw|un|qb|fi|zm|vn|oz|kt|rq|ay|fn|yc|um|eq|eu|cz|yq|tq|oi|ek|az|fv|zx|ut|vz|ry|ac|ws|af|qv|ea|qj|al|ol|on|sx|ap|df|eg|rz|ey|em|ag|hi|iz|ki|xz|xj|ad|ft|pt|op|vt|oj|kn|pr|hq|eb|ev|cx|zd|am|ov|oq|ym|ef|ot|mr|rd|sy|oc|rc|oe|fq|cn|ok|rn|bp|yv|uc|wk|oy|bt|je|ow|xg|jj|rw|pp|ja|wt|lf|xe|wy|kx|sm|qe|fw|gc|xa|cw|zn|tn|cc|jo|md|sd|ql|kq|it|bd|sc|wv|fc|dw|ob|vm|ed|jl|xo|fl|gq|gt|of|pv|wd|qa|xk|yd|fe|og|iq|oa|uq|om|xv|mv|as|ox|km|zt|od|ht|el|hn|st|wn|mt|wi|tz|aj|yg|bw|jf|jg|kz|es|xb|ax|rt|gx|bb|qo|yf|ex|rx|tt|us|qg|pe|zw|mp|qh|rm|hc|np|jh|cm|yl|eo|ra|vc|aw|tw|fk|gm|ec|be|vq|fd|jk|in)$/$1$3/
|
||||
|
||||
Reference in New Issue
Block a user