CreateArtTechnology / Blog
  • 什么是“丝滑”的曲线
     14     2021-12-08 11:58:45

    背景今年雷军“被骗”的新闻轰动一时——传闻小米花数百万邀请国际设计师原研哉为品牌Logo升级,而升级后的Logo看起来却跟原本的看起来没什么区别,网友大呼“这钱白花了”、“不就改个圆角矩形样式 border-radius: 19px; 就行吗”……看到原研哉照片后甚至有人说是老罗染发出来骗钱了,老罗本人还出面辟谣。
    小米Logo对比
    老罗辟谣
    当然,设计大师带来的品牌升级值不值数百万暂且不讨论,那小米的新Logo真的跟圆角矩形是一样的吗?曾经我也认为是,但在工作中了解曲线平滑后,我对此事有了新的看法。
    网友自制圆角矩形Logo
    曲线连续的等级正如高数中提到的“函数连续不一定可导,但可导一定连续”,函数可导称得上是一种“更高等级”的连续。挪用过来,函数的导数即斜率连续意味着某种好的连续。推而广之,函数的二阶导数连续则代表曲率(曲线的弯曲程度)的连续,等级更高……
    ......

    共20张


  • 背景工作中经常需要跟空间数据打交道,因此频繁使用一个工具类com.vividsolutions.jts.index.strtree.STRtree。STRtree类似于一个集合,向其插入一些带空间信息的数据后可以很便利地按范围查询空间数据,如下图示意。
    范围查询
    由于不清楚STRtree的查询实现逻辑,为探明原因及避免后续踩坑了解了一下,发现STRtree应用了非常精巧且应用广泛的空间索引结构R树(R-Tree)及优秀的批量加载算法STR。下文我们将从R树开始介绍,进一步了解STR算法,并说明一些STRtree相关的注意事项。
    R树是什么
    R树是用来做空间数据存储的树状数据结构。例如给地理位置,矩形和多边形这类多维数据建立索引。R树是由Antonin Guttman于1984年提出的。 …… 可以用它来回答“查找距离我2千米以内的博物馆”,“检索距离我2千米以内的所有路段”(然后显示在导航系统中)或者“查找(直线距离)最近的加油站”这类问题。R树还可以用来加速使用包括大圆距离在内的各种距离度量方式的最邻近搜索。——维基百科
    R树是一种层次数据结构,它是B树在k维空间上的自然扩展,因此和B树一样,R树是一种高度平衡树,在叶结点中包含指向实际数据对象的指针。
    ......

    共11张

  • 关于分库分表的一些事儿
     13     2021-06-24 22:11:52

    背景前几天在流动工位听到一同事在电话面试候选人,听他问:“分库分表接触过吗,分别是为了解决什么问题”,让我联想到曾经有一个面试官问没接触过分库分表的我——如果由我来设计,如何实现分库分表?
    是啊,分库分表原理是什么,具体又应该是怎么实现的,我当时的想法对不对呢?
    介绍单库表的问题通常在业务发展初期,一系列相关数据通常存储在一张单表中,比如user表,article表等。随着业务的发展,单表存储的数据量可能十分巨大,达到几千万甚至上亿;同时一张表的字段可能也扩展到几十上百个,此时可能带来一系列问题:
    资源不足
    单机的IO、连接数都是有限的,一旦并发量过高DB就会成为整个系统的瓶颈
    读写效率降低
    ......

    共5张


  • 引言在生活和工作中经常会遇到一些需要资源分配的时候,例如
    公司发的礼物不喜欢,想跟其他人换在线扭蛋机的交换系统实现求职offer的选择高考投档系统实现
    其中1、2属于单边匹配,匹配由单边期望决定,即“买方”决定;3、4属于双边匹配问题,匹配过程需考虑“买卖双方”的期望。
    在通常情况下,我们期望获得一个尽可能合理而稳定的分配结果,使得最终整体收益最大化。
    罗伊德-沙普利(Lloyd S. Shapley)与他人提出了一系列市场的稳定配置机制,为博弈论和经济学领域做出了巨大的贡献,最终与艾尔文-罗斯(Alvin E. Roth)一同获得2012年获诺贝尔经济学奖。
    背景之前写过在业务中遇到了判定业务,而该判定业务实际上是一组给定对象与另一组给定对象的匹配问题:
    ......

    共11张


  • 本实践使用了阿里云机器学习平台PAI
    项目背景原本业务内容是比较常见的判定业务,即输入为某个实体有一定误差的测量信息和相关参考信息,输出为其应当归属的实体。套用一个简单场景就是输入一篇未署名文章,根据文风归属到库中已存在的作者名下,抑或是归属到一个新建的匿名作者名下。
    问题的难点在于:
    分类实体数量较多,在百万量级分类数量不确定,且在动态变化,即有新增和过期测量存在误差场景较多
    评价标准:
    归属要准确(作者名下文章不要错)少遗漏(文章能尽量找到作者)避免错误创建(同一作者不要创建多个实体)
    ......

    共8张