小说屋

手机浏览器扫描二维码访问

第27章(第2页)

作为一名合格的科研工作者,谢与非首先开始做文献收集工作。

Sci-Hub是用不了了,KI上的文献也不算很多,于是谢与非只好从最基础的做起——先筛选知名小说网站和APP。

不多时就进入到了着名的网文论坛,从中筛选出基本符合要求的平台若干。

然后再细分,哪些网站以霸总小白文见长,哪些受众比较多样化。

接着呢,就是科研狗们最喜欢的收集数据阶段。

谢与非花了两个晚上,研究了各类榜单的排名和更新依据,从论坛里搜集了大量资料,甚至搞明白了几大平台女频的各种打榜暗箱操作。

于是她——开始看小说了?

不,蠢蠢欲动想要写个刷票小程序和网站的算法较量一下,看能不能被识破。

但是理智告诉她,做研究要不忘初心,总结霸总的行为规律才是首要任务,于是又回归到了霸总文本身。

开始的时候,谢与非做了个Excel表,里面列了各个网站排名前十的霸总文,并且按照简介和名字做了分类。

通过阅读大量的书评,扫文号和论坛讨论贴可知,霸总文只是一个大项目,里面还分有不同的小类与流派。

根据题材可以分为重生,穿越,现实,古代等等,穿越下面还有,等小类。

根据风格还可以分为「甜宠型」,「强迫型」,「型」,「契约情人型」等等。分析平台的榜单排名可知,目前「虐恋型」已经过时,「甜宠型」和「火葬场型」正在当红。

表列到这里,谢与非发现单纯的表格已经不能满足她了,这种复杂的分类需要一个坐标系。

于是画起了横轴和纵轴。

除了文章风格,作为霸总文灵魂的「霸总」当然也需要分类。

什么型霸总,粗暴型霸总,外冷内热型霸总,智商极高型霸总,反正也是需要一个坐标系来画明白的。

画着画着图她的思维又开始奔逸了,像霸总文这种具有高度同质性并且特徵明显的小说,是不是可以先收集大量数据建立一个语料库,然后再写一个算法让AI自动出产霸总文,只要输入想要的属性标签,然后就可以自动从语料库里摘取句子生成语段。同理可证那些打脸文丶丶文都可以一样产出。

小贴士:如果觉得不错,记得收藏网址或推荐给朋友哦~拜托啦(.)

:||

多米诺爱情  死对头老公出轨观察日记  在年代文离婚后的幸福生活  请认真搞笑  御厨大人她有新派料理[美食]  [历史同人] 天幕剧透后秦始皇手握封神榜  夜路行人  [原神] 原初之母竟是我自己  夜间飞行  缘来很甜  星际第一符籙机甲师  欲拒还迎后男主精分了  鼻炎Beta生活手册  绿茶女配的前男友们  影后娘娘升职记  瑞雪临  苗疆少年的小情蛊  八零漂亮后妈,嫁个厂长养崽崽  山青卷白云:女翻译与王维  七十年代创业忙  

热门小说推荐
黄天之世

黄天之世

苍天已死,黄天当立,岁在甲子,天下大吉!苦难,腐败,欺凌!我等小民饱经苦难,官吏腐败横行,肆意欺凌我等,我等不过是贩夫走卒,农人兵丁,家无立锥,不为大汉天子所知,对于高高在上的大汉天子,不过蝼蚁!官兵称我等为蛾贼!!!天下大旱,颗粒无收,而赋税益重,只因宦戚权贵骄奢淫欲,沉迷享乐!我等家无立锥之地...

我在天边,去弑仙

我在天边,去弑仙

关于我在天边,去弑仙你以为的朋友可能是敌人,你以为的废物可能是强者!永远不要用利益考验人心,人之初,性本恶!司空寒人与仙之间的差距真的那么大吗?我不信!!!我要弑仙,在天之巅!...

乱世武道:从偷看邻家姐姐开始

乱世武道:从偷看邻家姐姐开始

关于乱世武道从偷看邻家姐姐开始大乾武国,这个世界暴雨,雷电,酷暑,民不聊生,也有帮派,世家,宗门,诸侯割据,笼络天下资源。许华穿越过来,成为了一名底层矿工,吃不饱,穿不暖,日子比狗都过得艰难。就在某天晚上,自己邻家姐姐正在沐浴,他就偷看了一眼,结果一脚摔倒在地。等许华醒来过后,发现自己获得一键升级系统。一门武学别人苦修三年,他只需一秒升级。别人修炼一门武学,他则是能身兼百门。...

四合院:阎解旷的潇洒人生

四合院:阎解旷的潇洒人生

关于四合院阎解旷的潇洒人生阎有矿无意中开启了空间穿越到了四合院世界,成为了三大爷阎埠贵的三儿子阎解旷。阎解旷到了四合院,先打断盗圣棒梗的腿,收了些利息。接着又给四合院的养老团添了一些堵。只要你不让我好过,我就不让你舒服。我不舒服了,你们也别想开心。在这四合院世界里,我阎解旷想怎么样就怎么样!...

青州第一大秘之情路

青州第一大秘之情路

有人的地方就有江湖,江湖不是打打闹闹,是隐藏在平静湖面下的刀光剑影王皓因意外可能升职不成,未婚妻变心去相亲,却意外获知王皓升职成为大秘书...

我当捕快那些年

我当捕快那些年

侠之大者,为国为民。让宵小之辈有所震慑,让权贵之人有所忌惮,为沉冤者得雪,为弱小者仗剑,为天下开太平!微信sanguanyouzai。交流公众号三观犹在。...

每日热搜小说推荐