全球主机交流论坛

标题: 救急!Word高手请进,困扰很久了 [打印本页]

作者: GALA    时间: 2022-8-5 13:42
标题: 救急!Word高手请进,困扰很久了
本帖最后由 GALA 于 2022-8-8 16:21 编辑

各位亲爱的同事:
送出⼀本好书,打开⼀扇亮窗。把⼿中闲置的书籍,捐赠给贫困地区⼩学校的孩⼦们,为他们的梦想插上知识的翅膀。
⼀本书,就是⼀个世界。⼀本书,就是⼀个窗⼝。物质上的艰苦阻挡不了贫困地区孩⼦们对知识的渴求,他们渴望通过与书的对话丰富精神世界,渴望掌握更多的知识来改变窘迫的⽣活状态,改变⾃⼰的命运!为了向这些贫困地区的少年⼉童献上⼀颗爱⼼,帮助他们圆⼀个美丽的读书梦。

----------------------------
链接: https://pan.baidu.com/s/19JQof4lQsLD_vWw9VIWqZg 提取码: s6w6 复制这段内容后打开百度网盘手机App,操作更方便哦
--来自百度网盘超级会员v1的分享
大家可以下载帮忙看看
----------------------------

问题描述:⼀、⼿、⼩、⼉、⼝、⾃⼰

这种明显的不一致文字是怎么回事?我把文字复制到文本,或复制到网页里,还是复制到作图软件,要么变成口口,要么直接乱码不识别了。
我不想挨个打字替换,太难了。

----------8.8更新 28楼大神已经解决--------------

搞定,看了一下,这些异形字的编码都是 E2 开头的,属于康熙部首,直接把康熙部首转换成相同外形的文字编码即可。

有现成的工具 https://www.loghao.com/kangxibushou,直接把全部文字复制进去,会自动替换里面的康熙部首。

自己写一个也很简单,康熙部首就两百多个字符,搞个替换表,遍历一遍替换就行。
作者: iks    时间: 2022-8-5 13:48
这种明显的不一致文字是怎么回事?我把文字复制到文本,复制到网页,复制到作图软件,要么还是这样,要么直接乱码不识别了。
我谔谔,没有截图吗?
作者: аdmin    时间: 2022-8-5 13:49
字体?
作者: n8n    时间: 2022-8-5 13:51
根本不知道你说的是什么

作者: xian    时间: 2022-8-5 13:53
问题图片 发出来 ,等待 上班摸鱼的MJJ
作者: yuqyu    时间: 2022-8-5 13:55
这种应该不是中文 起码不在GBK编码体系里
大概率是OCR转出来识别的问题。
作者: GALA    时间: 2022-8-5 14:11
yuqyu 发表于 2022-8-5 13:55
这种应该不是中文 起码不在GBK编码体系里
大概率是OCR转出来识别的问题。

可我们领导是手动自己打的啊,
作者: GALA    时间: 2022-8-5 14:12
iks 发表于 2022-8-5 13:48
我谔谔,没有截图吗?

论坛上传不了图啊,有图床吗
作者: Perfwiki    时间: 2022-8-5 14:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: Ayug    时间: 2022-8-5 14:17
感觉应该是编码问题,他用的编码,和你们不同
作者: 比特鼻    时间: 2022-8-5 14:21
  1. ctrl+shift+v
复制代码

作者: GALA    时间: 2022-8-5 14:22
Perfwiki 发表于 2022-8-5 14:14
拷贝到emeditor,再另存为gb2312编码格式
如果有乱码的,直接手动改下
再拷贝回word ...

没有gb2312,改成ANSI,有问题的文字都变成  “?”了,应该是乱码的问题,可我本来就知道文字就问题,就是不想一个个的修改而已。有其他办法吗
作者: GALA    时间: 2022-8-5 14:23
Ayug 发表于 2022-8-5 14:17
感觉应该是编码问题,他用的编码,和你们不同

嗯,应该是编码的问题,我改成ANSI,有问题的文字直接变成“?”了。可我本来就知道文字就问题,就是不想一个个的修改而已。有其他办法吗
作者: tkn    时间: 2022-8-5 14:38
GALA 发表于 2022-8-5 14:23
嗯,应该是编码的问题,我改成ANSI,有问题的文字直接变成“?”了。可我本来就知道文字就问题,就是不想 ...

把要替换的字符放到二维数组,写代码遍历一遍替换呗,还能怎么办
作者: GALA    时间: 2022-8-5 14:40
本帖最后由 GALA 于 2022-8-5 14:57 编辑
tkn 发表于 2022-8-5 14:38
把要替换的字符放到二维数组,写代码遍历一遍替换呗,还能怎么办


弄错了,问题没有解决
作者: tkn    时间: 2022-8-5 14:43
GALA 发表于 2022-8-5 14:40
我本想把Word上传到百度云盘,让大家下载看下,上传后我先测试了一下,发现所有文字的问题没有了,这是什 ...

发,我可以帮你看下
作者: fenggang    时间: 2022-8-5 14:44
清除格式
作者: GALA    时间: 2022-8-5 14:50
tkn 发表于 2022-8-5 14:43
发,我可以帮你看下

链接:https://pan.baidu.com/s/1bU00i73U2Op3Xc3Zd35O_w
提取码:5qte
--来自百度网盘超级会员V1的分享

文本文档下载还是之前的问题,你可以放大看下,文字有很明显的区别
作者: 我不是你的    时间: 2022-8-5 14:51
我之前在网上复制文字也遇到这个问题,最后放弃了,手打的。
作者: GALA    时间: 2022-8-5 14:52
我不是你的 发表于 2022-8-5 14:51
我之前在网上复制文字也遇到这个问题,最后放弃了,手打的。

这个是我老板发我的,难道说部分内容他也是网上直接摘抄的?
作者: GALA    时间: 2022-8-5 15:01
tkn 发表于 2022-8-5 14:43
发,我可以帮你看下

链接: https://pan.baidu.com/s/19JQof4lQsLD_vWw9VIWqZg 提取码: s6w6 复制这段内容后打开百度网盘手机App,操作更方便哦
--来自百度网盘超级会员v1的分享


老哥可以直接看这个,在线浏览有问题文字都变成“口口”了
作者: 我不是你的    时间: 2022-8-5 15:01
GALA 发表于 2022-8-5 14:52
这个是我老板发我的,难道说部分内容他也是网上直接摘抄的?

百分百分是的,无论是用QQ、微信、文本文档、代码编辑器之类都搞不定。
作者: GALA    时间: 2022-8-5 15:04
我不是你的 发表于 2022-8-5 15:01
百分百分是的,无论是用QQ、微信、文本文档、代码编辑器之类都搞不定。

对,我都尝试了不行。最后我是所有文字截图用文字识别软件做的
作者: MZJC    时间: 2022-8-5 15:09
感觉是个bug,https://www.bilibili.com/video/av596703637 先搜索看看有多少个字,然后录制宏
作者: YIem    时间: 2022-8-5 15:22
可以复制啊,没啥问题就字体不一致而已
作者: GALA    时间: 2022-8-5 15:39
YIem 发表于 2022-8-5 15:22
可以复制啊,没啥问题就字体不一致而已

复制ps软件里想做效果,或者复制到其他文本里,就变成口口了
作者: YIem    时间: 2022-8-5 15:42
GALA 发表于 2022-8-5 15:39
复制ps软件里想做效果,或者复制到其他文本里,就变成口口了

这个应该是没有对应的字体啊,导致无法识别变成 “口”
作者: tkn    时间: 2022-8-5 15:58
本帖最后由 tkn 于 2022-8-5 16:12 编辑

搞定,看了一下,这些异形字的编码都是 E2 开头的,属于康熙部首,直接把康熙部首转换成相同外形的文字编码即可。

有现成的工具 https://www.loghao.com/kangxibushou,直接把全部文字复制进去,会自动替换里面的康熙部首。

自己写一个也很简单,康熙部首就两百多个字符,搞个替换表,遍历一遍替换就行。
作者: zhou0911    时间: 2022-8-5 16:20
我在word2010里打开正常,但是部分字体很怪异,改不了,反正内容没多少建议楼主自行一个个修改


作者: GALA    时间: 2022-8-8 16:15
tkn 发表于 2022-8-5 15:58
搞定,看了一下,这些异形字的编码都是 E2 开头的,属于康熙部首,直接把康熙部首转换成相同外形的文字编码 ...

大神,请收下我的膝盖
作者: SpaceX    时间: 2022-8-8 16:19
这个问题我遇到过,不可能是你们领导手打的,基本可以确定这篇文章是通过ocr识别出来的,因为我遇到过这种问题,两个看起来一模一样的字,就是不一样,一问才知道是拍照识别的
作者: GALA    时间: 2022-8-8 16:20
SpaceX 发表于 2022-8-8 16:19
这个问题我遇到过,不可能是你们领导手打的,基本可以确定这篇文章是通过ocr识别出来的,因为我遇到过这种 ...

谢谢分析,看置顶帖已经有人解决了
作者: mjj666zzz    时间: 2022-8-8 16:34
GALA 发表于 2022-8-5 14:11
可我们领导是手动自己打的啊,

口说无凭




欢迎光临 全球主机交流论坛 (https://lilynana.eu.org/) Powered by Discuz! X3.4