“标签体系”建设的复盘与思考以“城市治理业务”标签体系建设为例详解

来源:bob下载    发布时间:2024-07-08 10:25:19

  许多业务都需要涉及到标签体系的建设,尤其伴随义务的扩大,标签体系需要趋向精细化,以支撑最终的精细化运营。那么,标签体系该如何建设并应用至业务场景中?本文作者结合案例做了梳理和解读,一起来看。

  各行各业在实现其自身业务目标时,都逃不脱的一个工作环节就是:标签体系的建设和优化迭代。在业务开展初期,标签体系往往无需过于庞大,满足业务使用即可;但随着业务的发展壮大,标签体系势必会持续迭代、甚至越来越精细化,以支撑精细化运营,而精细化运营的最终目的是提高营收,即让更多的消费者/客户,持续性的选择你的商品/你的服务(更多的用户、更多的消费频次)。

  所以,我们看:不论是卖商品的电子商务平台,卖酒店服务的O2O平台,卖房子/租房子的链家平台,卖火锅的海底捞餐饮店,还是家门口的物美超市,还是提供内容服务的平台(如音乐App、小说(网络文学)平台(七猫、微信读书)、今日头条等新闻咨讯类平台,小红书),其产品逻辑内部,一定会有一个模块是【标签体系/标签管理】。

  比如,在【人人都是PM】平台上,输入“标签体系”关键词搜一搜,就能够获得如下结果:

  ——标签,是用来给你所分析的业务对象分类、打标签用的,需要包含标签名称、标签别名(在大多数情况下要有)、标签定义、标签数据样例。

  比如你对你未来另一半的期待,你可以用标签化的形式来提需求,比如“身高要大于180cm”、“学历不能低于本科”、“性别男”、“年收入50万以上”等等,这里面的身高、学历、年收入、性别,都是人(未来男朋友)这个对象的基本属性标签,此外还可以有行为习惯、兴趣爱好的一些标签,比如“喜爱摄影”、“喜欢读书”等等;我们个人简历中的每一项内容,实际也都是基于“标签体系”来展开的。

  再放大来看,我们对世界的认知,也是基于先人给世界(宇宙)中的万事万物定了义、分了类、打了标签。

  对于内容提供平台:需要打标的对象有:提供的内容本身(如提供的是音乐内容,音乐分为哪些维度?按国家、按音乐风格、按歌手、按流行度…?),以及潜在用户和老用户;

  对于卖火锅的海底捞:需要打标的对象有:火锅本身的治理(包括:火锅底料:是番茄味的还是菌菇味的?火锅套餐有哪几种?(单人餐、双人餐、三-四人餐?)不同选择下,火锅价格如何定价?),以及其消费者标签又如何。

  ——而标签体系,顾名思义就是“形成体系的一个标签集合”,比如“知识体系”、“课程教学体系”,不是随便的一个集合就能称之为体系,这个集合(体系)要科学、合理,即遵循MECE原则,且要便于管理维护和迭代。

  ——也就是建设标签体系,第一步是找到需要贴标签的业务对象;第二步在建立标签体系时,要满足科学合理(满足MECE原则)、可管理维护和可持续迭代,这几点要求。

  有自己知识体系、学习体系的人学习,其学习效率、学习质量,就是会比哪些零散化学习方式的人高。如果他俩PK,短期可能是后者胜,但长久来看,前者对后者一定是降维打击。

  在后续章节中,我会以“【城市治理业务】中的标签体系建设”为命题任务,试图探讨如何设计【城市治理业务】场景下的标签体系,以及探讨该业务场景下的“标签体系”,可用于支撑哪些业务功能?

  ——这个“鸡生蛋、蛋生鸡”的问题,我们先抛开。读到最后,读者必将自有体会。

  在“城市治理”(智慧城市)领域,同样逃不脱标签体系的建设。在建设标签体系前,还是要先了解业务。下面带大家探索一下“城市治理”相关业务,感兴趣的可继续往下阅读(内容有点长,可分两次阅读)~

  城市治理业务,狭义来说指的是【城市管理】,即由城管、交管等政府部门负责的各类违章事件的治理;广义来说,城市治理等于“一网通管、一网通办”,甚至再广点说,可以上升到国家安全层面的治理。

  参与广义城市治理的政府部门有:国安体系、公安体系、大城管体系的各级部门,如公安厅/局/xx总队/xx大队/xx支队(经侦、刑侦、网安、治安、技侦等),城运中心/城管执法局(如上海市虹口区城运中心,主要负责虹口区的12345和一网通管业务),国安体系的情报局/技侦局/网络安全局等。

  而城市治理的业务职责是:在法律权责约束下,解决城市运行过程中的一系列问题,包括基础设施的建设,人民和企业主体在日常生活工作过程中遇到的各类紧急及非紧急问题/事件,最终目标是运用各种先进的手段(管理手段、技术方法),逐步的提升人民群众的幸福感和满意度。

  P:国家国务院等部门,倡导各级政府领导班子,执行“一网通管、一网通办”城市治理策略,各政府部门数据要协同、协作,打通解决数据孤岛问题,切实利用适用于本地区发展的技术方法和管理手段,解决各自的业务问题,提高人民群众的幸福指数,打造城市治理标杆案例,提高国际影响力,促进国际交流合作;也陆续出台了一系列政策。近期23年9月份出台的政策,则强调更多的是运用人工智能、云计算等技术,提高城市科学化、精细化、智能化治理水平;见:

  E:经济水平,我国长期处在世界第二大经济体,虽然当前社会大环境不太乐观,且国家内部有些地区还属于贫穷的地方,但总体经济水平较前几个十年已经改善了很多;

  S:人们的生活水平(包括精神水平、物质水平)在国家的繁荣发展下,得以不断改善提高,所以人民和企业越来越看重政府的公信力,期望办事能够少跑几趟,政府办事效率提高,处理问题能力提高,切实提升社会主体中人民群众的幸福感和归属感;

  T:大模型、AI、云计算、互联网+等技术持续不断的发展,为各类业务场景提供了强有力的技术支撑。

  因此,整体看来,到2027年,城市治理业务的发展的新趋势,都围绕着一个主基调:科学化、精细化、智能化。

  早在上述政策出台前,也就是从2016年“互联网+”概念提出,再到后来的“AI+”战略提出,整个期间,一系列“互联网+”、“AI+”、“一网统管、一网通办”、“智慧城市”的产品和解决方案问世(市)。

  ——各家也是挑自家所长,做自己能做的解决方案/产品/服务/方案+产品+服务组合…

  ——而且各家的“解决方案/产品/服务/方案+产品+服务组合”也是逐步迭代、完善的一个过程。

  提供智能采集软硬件方案/产品,如商汤/旷视/海康威视的可以智能识别交通违章类型的摄像头、各种智能IOT设备(气压、气温、湿度、能见度检测仪等);

  NLP(自然语言理解、自然语言生成)技术,理解市民和企业需求。主要数据来源有大城管上报的、110口上报的…,通过数据融合汇聚-数据治理及分析,深度挖掘社情民意,给领导提供决策支撑。

  等能力,以一张图形式将城市中的人、地、事、物、组织进行关联,将城市中的人、地、事、物等城市核心要素落点落图,方便管理与决策;

  提供协同办公系统,如“国泰新点”、“首都信息发展公司”、“中国电信-亿迅”等,以使得政府内部各部门、各角色,能够将上报的城市治理事件进行分发、处置、流转等业务办理操作。

  城市治理业务的最终业务目标是:科学化、精细化、智能化。而一个科学合理的标签体系,是可以支撑上述业务目标的实现的。

  城市治理业务中,有非常多的细分业务场景,比如公安、消防、城管、交通、水务、气象、园林绿化…

  现阶段主流的做法是:每一个单点的业务场景,单独建立产品,单独管理自身业务。

  ——这就造成了各个政府部门之间协作力度不够,彼此之间的数据是孤岛,无法充分的发挥数据应有的价值,也就间接导致了城市治理成效提升不显著。

  开头提及的关于城市治理的最新政策文件中也指出了,到2027年需要构建【城市标准化工作联动机制】:部、省、市三级联动。

  ——所以在未来,充分的发挥城市治理人、地、事、物、组织、情报等要素的价值,各级政府部门联动、部门间协同联动,也将成为城市治理的主旋律。

  因此,在城市治理业务中,要想实现城市治理科学化、精细化、智能化运营管理目标,我想一定是会依托一个【城市业务运营管理平台】,该产品的最终预期是:部、省、市,以及市下面的区、街镇、社区/村通过这一个平台,实现部门间数据共享、业务的协同、联动。

  与此应用配套的,还应有专门面向领导指挥作战的IOC(领导驾驶舱)产品、面向一线工作者如网格员、消防员、警员的移动端产品。此外,还应有各类AI产品/服务、数据治理产品作为上述两款产品的底层基座。

  也就是整个智慧城市业务的产品形态应该如下(个人理解,读者可有自己的见解):

  老东家百度智能云,已有了上述几款产品,其售卖的典型客户是成都市某客户。想知道更多,大家可自行搜索百度云、华为云、阿里云、腾讯云、电信云等公司官网,查看这些大厂给出的具体解决方案/产品。

  思考一下,如果是你的话,你在如下真实的业务场景中,该如何建设“城市治理”业务下的标签体系?

  【城市事件智能识别系统】推送的“城管类”违规事件如“机动车乱停放”、“垃圾满溢”、“渣土车闯限行”、交管类”违规事件如“司机开车打手机”、“行人翻越护栏”;

  【12345业务系统】推送的“投诉xx小区301户噪音扰民-家庭生活娱乐噪音扰民”;

  【110接处警】系统推送的“投诉xx小区301户噪声扰民-生活乐器扰民”工单;

  也就是说,【数据融合治理平台】的数据来源方有多个,每个来源的数据(人、账号、车、事件、风险、部件等)可能已自带了多重维度的标签,也可能没有标签。

  负责上述【舆情系统】的产品建设(此产品内部需要标签体系来支撑系统数据治理);

  围绕“城市精细化运营管理”大目标,负责提炼“数据融合治理”平台相关需求,并拆解成产品方案,进行落地,需要仔细考虑的是不同业务系统生产的数据,可能指向同一业务对象,在数据融合治理时,有必要进行“实体对齐”。

  舆情系统,要解决的是,及时有效地发现网络上的风险舆情事件和风险话题,并进行预警推送,以及支持对任一话题、任一人物、任一组织、任一事件的网络行为监测及分析,支持业务定期撰写舆情分析报告;

  传统舆情系统,一般解决的是网上发酵的,且积累到一定热度的热点话题或热点事件的自动识别发现,并标记好业务分类,然后预警推送给相关业务方,以辅助业务方,基于推送的舆情分类标签及舆情详情,实现后续舆情工单的流转、处置;高阶一点的舆情系统(现在也成为基础要求),需要能够识别潜在的风险(现阶段还没爆发为热点,但存在引发社会舆论风险的可能);并支持对任一人物、任一组织、任一话题进行多维监测分析;

  舆情事件涉及的范畴非常广,文化领域的娱乐明星的瓜,政法领域的领导班子的瓜,典型社会人物的一些行为,均有可能成为网络上的舆情热点。

  为了使舆情事件(话题)分类科学,我采用如下分类纲领来进行设计参照,即政治、经济、文化、社会、生态五大一级分类,可保证标签完全穷尽。

  在政治一级类目下,运用MECE原则,尽可能根据历史舆情案例情况,列举出政治领域的相关舆情风险。比如“国家安全”、“国际关系”、“执政形象”;在国家安全问题下,又包含:“意识形态”、“领土安全”、“恐怖活动”、“民族宗教”等典型问题,同时为满足MECE原则,每个标签下补以“其它”,使得标签完全穷尽。

  其它一级分类向下拓展标签仍如此,需要对业务深刻理解(调研客户的真实需求+调研竞品+搜集书籍有关的资料),才能据此拆分出相互独立、又完全穷尽,又满足业务使用需要的标签体系。

  最终按上述方法,我构建了一套具有四个层级,共600+标签的舆情事件分类体系,这里列出部分:

  在建好了这套标签体系后,为了使得标签可维护、可管理、可迭代,需要辅以【标签管理】工具/平台。系统AI算法和运营人员,均可以参照标签体系中对标签的定义(标签名称、标签数据样例、标签别名等)对业务对象打标。此外运营人员,还可以管理标签,修改标签别名、删除/编辑/添加标签语料等操作。

  人物标签(画像)的构建思路:可以从“基本属性”、“行为习惯”两个维度来拆分;而关于人的基本属性标签和行为习惯标签,还均可以按事实标签(即真实情况)、机器预测标签来拆分。

  人的姓名、性别、出生日期、车牌号、身份证号、社交账号、电话号等均可以看作是人的基本属性;

  行为习惯,一般则由动态统计标签来构成,比如“最近3个月访问xx网站次数”这样来定义,也可以定义一个标签:“活跃”,其含义代表:最近x时间网络有发言且发言量大于n条(x,n支持配置)。

  “数据融合治理”平台作为“城市精细化运营管理”的支撑方,需要支撑其实现 “精细化、智能化、科学化”的城市治理目标。

  在前面也提到了,【数据融合治理平台】的数据来源方有多个,每个来源的数据(人、账号、车、事件、风险、部件等)可能已自带了多重维度的标签,也可能没标签。作为数据融合治理平台的PM,该如何规划设计【数据融合治理平台】产品功能呢?以及数据融合治理平台的“标签体系”该如何构建呢?

  ① 首先数据融合治理平台,需要对接不同数据来源不同数据规模、不同频次的数据,并入库存储;–因此就需要具备【大数据】存储和管理功能,并提供入库接口或其它数据入库方式(如kafka中间件);在技术选型上,需要仔细考虑支撑实时数据处理、离线数据处理等多种场景。

  ② 由于各类数据可能是结构化的,可能是半结构化的,也可能是非结构化的(办公文档、文本、图片, HTML、各类报表、图像和音频/视频信息等),因此就需要具备对半结构化和非结构化数据的处理能力;

  ③ 因为数据融合治理的实体对象包括:人、地、事、物、组织。因此需构建相应的人、地、事、物、组织数据库,以及它们之间的关联关系数据库,支持业务查询使用。并支持运营人员,对关系库中的关系来管理,对实体库中的实体打标签。同时还需要支持运营人员,对打标用的标签库中的标签做增删改查。

  所以还应配套一个【标签管理】工具,用于管理标签数据包括:标签名称、标签别名、标签含义、标签关键词词包、标签语料(图、文、视频、音频),以支撑算法使用该标签对数据打标。配套一个【关系管理】工具。

  ④ 需要利用AI算法(文本相似度算法、图片相似度、跨模等技术)进行实体及实体属性的对齐,即不同的描述,但均指向同一对象;又比如不同社交账号,但其使用者均为同一人;再比如同一事件(涉事主体、事件摘要、事发地均为同一地点),但文本描述上不一样,需要运用NLP语义识别能力,将其识别出来并做好归一,并给出相似度分数。

  再比如同样一个标签,在业务场景A种叫做“噪音扰民”,在业务场景B中叫做“噪声扰民”,但本质是一个意思,这就需要在数据治理时,对标签名称进行规范化(规范化的一个好处就是:提高数据治理的效率;当然有些标签在不同业务场景中就是有自己独特的定义,这时便不需要做规范化处理,详细情况应该要依据实际业务场景甄别)。

  ⑤ 需要利用算法和策略,尽可能多维度地完善人、地、事、物、组织的画像标签。

  ⑥ 需要利用知识图谱技术挖掘人、地、事、物、组织彼此之间的关联关系,这些关系可能包含显性关系(即张三与李四是“母女”关系;“张三”与“白白”近期在微博平台互动100次;),在大多数情况下要人工提前梳理出【实体-关系-实体】关系集合,以引导实现初版策略,而后算法可基于这个策略自迭代;

  ⑦ 数据融合治理成果(即打了多维度标签的人/地/事/物/组织),需要支持业务多条件查询,或主动push给业务,供业务查看。

  以上,便是本文的全部内容了。本人关于【数据融合治理】、【大数据平台】的产品架构,以及核心功能,还有待调研攻破~ 可关注后续文章~

上一篇:梅州关于开展2023年度梅州市知识产权保护资助工作的通知
下一篇:【48812】张掖市甘州区北街商场监管所展开标准散装食物出售专项查看