CreateArtTechnology / Blog

  • 本实践使用了阿里云机器学习平台PAI
    项目背景原本业务内容是比较常见的判定业务,即输入为某个实体有一定误差的测量信息和相关参考信息,输出为其应当归属的实体。套用一个简单场景就是输入一篇未署名文章,根据文风归属到库中已存在的作者名下,抑或是归属到一个新建的匿名作者名下。
    问题的难点在于:
    分类实体数量较多,在百万量级分类数量不确定,且在动态变化,即有新增和过期测量存在误差场景较多
    评价标准:
    归属要准确(作者名下文章不要错)少遗漏(文章能尽量找到作者)避免错误创建(同一作者不要创建多个实体)
    ......

    共8张