加载中...

地址发布 老王说明书 宣传中心
此板块只作为纯讨论

正经话题,不搞色情!贤者时间必备
查看: 3019|回复: 1
收起左侧

[学习讨论] 关于H文校对的一些技巧和疑问

[复制链接]
发表于 2024-7-19 09:11:05 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?免费注册

x
起因:因为下载了吧内《P站超全合集30000+本 加上大量细分tag分类》这个文件
" T/ j7 U8 B. G' J: j问题:每文的开头都是以下格式:0 Y$ ^; \) d* i+ a0 h(欢迎访问老王论坛:laowang.vip)
['9260472', '女帝的一二三四五六事', '纪银徵和她的,嗯,男朋友们的故事?纯爱战士,退退退!', ['R-18G', '疼痛', '孕妇', '出产', '羊水', '中文', '妊娠', '恋愛', '孕交'], '`Moss', 5]
, ]1 m) Q2 \1 z6 R* j
. p8 u* R4 ]4 x9 u['1546193', '北国万象', '本系列现在仅作为都市背景的合集\n每一篇的具体设定并不一定完全相同', ['R-18G', 'オリジナル', '中国語', '剧情向', '処刑', '百合', '猎奇', '秀色', '血腥', '斩首'], '〆リクキ〆', 5]……
7 F( E8 V9 B- ?/ n1 h$ @% l: y
# H  M, |. Q* o1 |5 B$ H- e2 o) w6 S! h; j! f(欢迎访问老王论坛:laowang.vip)
不影响观看,但是又有点不舒服,所以想要校对一下,经过一些努力,总算校准了一点,但是还是有一些问题,所以发帖和大家讨论一下。
) w9 g4 J! Z6 v7 g+ n: U& U( ?7 B# Y; T+ {! `' \7 z(欢迎访问老王论坛:laowang.vip)
校对软件:EmEditor' I2 u! q  s0 ~" a# y( y(欢迎访问老王论坛:laowang.vip)

$ @/ t/ ]; q  W- V: m+ z用正则表达式进行查找替换后可以把开头格式转换为图1图2所示:
1 p, d. V. R( T. _! N8 {& P
/ [- ?) R2 e7 {( T5 s1 }- p2 V表达式:查找\['\d{4,7}', '(.*?)', '(.*?)', \['(.*?)', '(.*?)'\], '(.*?)', (.*?)\]    替换\1\6\n\5\n\2\n\[\3,\4\]
1 a  {1 u+ w0 }' F0 B: M' y8 @! I5 v0 s5 x* a(欢迎访问老王论坛:laowang.vip)
经过校对后书名章节数作者简介都很好,但是在文章标签这块,也就是我举例中的['R-18G', '疼痛', '孕妇', '出产', '羊水', '中文', '妊娠', '恋愛', '孕交']和['R-18G', 'オリジナル', '中国語', '剧情向', '処刑', '百合', '猎奇', '秀色', '血腥', '斩首']这块出现一点小问题,并没有出现我希望的[R-18G,疼痛,孕妇,出产,羊水,中文,妊娠,恋愛,孕交]和[R-18G,オリジナル,中国語,剧情向,処刑,百合,猎奇,秀色,血腥,斩首]的格式,也就是替换后这里面还是出现了', '这个(如图),并没有替换成中文逗号,虽然可以进行二次处理,但是有点麻烦,经过检查,这是由于查找表达式中这一块', '(.*?)是连在一起被表达的,所以在替换中这一块中间的', '是没有被换成中文逗号,但是由于标签数量不固定,也就是可能是9个可能是10个或其它数量,所以尝试了很多办法,还是没有能够很好的处理,所以请吧友们帮帮忙,有什么方法能够处理。表达式引擎是Boost.regex。
- J7 H5 q& C$ J" C6 o) R5 I3 f& E: T6 B) h& K(欢迎访问老王论坛:laowang.vip)

; y. M3 X* \- |
& |& J1 y6 z7 Q8 Q# R
图1.jpg
图2.jpg
回复

使用道具 举报

发表于 2024-7-23 07:14:24 | 显示全部楼层
因为我不太了解正则,所以花了半天找了找,有个叫“平衡组”的东西好像就是解决这种“标签里的标签”的问题的。
& F# S' E6 V0 m  q6 E5 l不过我不太懂,推荐您看看这个 https://blog.csdn.net/lxcnn/article/details/4402808
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册
点击进行验证

本版积分规则

我们不生产资源,只做资源的搬运工。

tags标签-春满四合院-AvGood-Archiver-小黑屋- |网站地图