前两日与文必龙教授谈自标准,他提及了淘宝的自动标签。
为了加快搜索速度,淘宝给货物贴标签,就是加关键词。
一开始由卖家自己自由加标签,后来相同或相近货物的关键词会自动趋同,系统能够发现规律,并识别出来高频关键词。
而高频的基本就是合理的,实例越多越可靠,足够多的实例支持的标签就可以成为正式标签,即标准。
这是标准的自动演化实例。自动学习,自动演化,自动发现。应该大力研究。
从本质上来说,这是一种大数据的应用,即,用大数据技术辅助制定数据标准,甚至自动形成标准。
这是个很神奇的事——“自己刀削自己的把儿! ”
数据自己给自己制定标准。——从系统观的角度看,这也是自组织理论的作用。——从哲学层面看,这是本体论和认识论的综合。我受了今天看到的那篇文章《破碎的系统观》影响了。
我看这可以成为一个研究方向。
自标准通过在同时加大的数据应用积累过程中,用大数据本身规范自己,使自己从自标准进化成正式标准。至少是辅助正式标准的制定。
想想现在我们是怎么制定标准的?
一帮专家来定。其实假专家不少,我就时常滥竽充数;还有,真专家不仔细思考也不能定出好标准。
这样的标准有时真的不如机器发现出来的好。
让大数据本身来给自己定标准吧,我们只是引导他,帮助他。
上帝的归上帝,凯撒的归凯撒。
人工智能可能也会有了一个新的发现思路。
写到这里,我又想起了我自己的故事(就这小点儿故事,总想起。唉!哥是个没故事的人啊。..):
《最后防线》,它是一个数据恢复软件,是我93年编的,获得了软件著作权,可能是大庆首例。
它的功能是:当你的电脑操作系统都崩溃了,只要硬盘没有完全低级格式化,剩下的数据都可以恢复出来。
因为电脑自动做了备份,但神奇之处是,备份的数据仍然存在这个已经崩溃的电脑上。
崩溃的电脑拯救自己,这是不是悖论?
但是,我实现他了。
我给当时的大佬王江民老师汇报,老爷子骂了我一顿——你个小兔崽子,太猖狂了,根本不可能!悖论!我说,我去给您看。他说,不要浪费我的时间,基本的科学素养都没有,还做什么程序员!
我很无奈,没人懂我。
但此后我就不再盲目迷信权威了。也是收获吧。
哲学思考一下,这是怎么回事?又是自己的刀削自己把儿。
我怎么总干这样的事?
谁来拯救我?..(整理及编辑:张凯)


