“这样数据资料有价论的逻辑也就清晰了。”
朱靖垣听完之后看向朱迪钚:
“老二你怎么看?”
朱迪钚沉默思考了几秒钟,最终慢慢的点着头说:
“我觉得迪镧的话有道理……
“用微积分的逻辑来评判和区分学习、模仿、抄袭的界限是个很不错的理念。
“未来的公共网络平台上,创作者上传自己的作品的时候。
“应该有一个是否允许机器学习的选项。
“同时也应该有一个是否使用大数据筛选和推荐信息的选项。”
朱迪镧听了马上附和说:
“我赞成二哥的意见。”
朱靖垣笑着说:
“既然你们哥俩都觉得可行,那这些事情就这么定了吧。
“不过问题是,你们怎么判断一个数据模型,是否用了未经授权的材料来训练呢?
“在数据分析层面你们有办法区分吗?”
朱迪钚想了想说:
“可以在未经授权的素材中添加一些验证数据,规避未经许可的机器学习的使用甚至污染数据模型。
“不过……单纯依靠技术手段是不行的,无法完全规避违规者的破解和甄别以及反破坏技术。
“所以还是要用社会和制度层面的限制以及事后处置方法……”
朱迪钚说到这里看向了弟弟。
朱迪镧想了想说:
“制度上有两个方向,一个是默认全部授权,同时默认全部收费。
“目前互联网上的大规模艺术作品平台,都是朝廷和四大产业集团的官方平台。
“民间厂商和用户想要自行建立数据模型,只能从这些平台上采集数据。
“所以可以规定,没有向现有平台之一付费取得授权资格的厂商,都直接按照违规处罚。
“另一个方向,是就由四大产业集团出面,各自设计一套基础软件框架。
“相当于一个带有强制过滤和筛选功能的装置。
“民间厂商做任何的数据训练,必须在这个基础软件框架之上开发。
“也就是放在这个过滤装置之内。
“这个过滤程序自动甄别未经授权的材料标记,直接不将未经授权的材料投入训练过程。
“同时互联网上应该在授权和未授权的材料上加入专门标记。
“供过这些滤装置直接识别。
“这些方案可以与二哥的技术方案同步实行。”
朱迪钚听了不由得点头:
“好,识别和反训练技术是必须开发的。”
朱靖垣也没有评价两人的设想,就让朱迪钚和朱迪镧哥俩商量着办了。