华为重磅发布网络AI领域10大公开数据集

2020年3月20日,在华为开发者大会HDC.Cloud 3月20号直播间,华为网络人工智能数据湖专家周尧,向开发者们正式发布了网络AI领域10大公开数据集,解决了网络AI开发缺乏工业级数据的难题。

迄今为止,波音手中积压了超过400架已完成却未能交付的飞机。每个季度因制造和储存飞机更是要消耗掉约44亿美金。在这样的利弊权衡下,波音737 MAX不得不从停飞走向停产。

这些“问题飞机”,为何仍能上天?

四面楚歌?波音家族客机问题频出

同样的,亚当•迪克森曾在华盛顿州兰敦的波音工厂参与 737 MAX 飞机的生产。他对媒体表示,那里也是只讲进度,不管程序和质量。他所在的团队经常为程序和质量问题,跟车间交涉,求助公司高层,却没起到什么作用。

甚至在两起空难发生后,FAA也迟迟未宣布停飞737 MAX,最终在总统令之下才将其停飞。

皮尔森感觉到前所未有的不安,他说,“我甚至不敢让我的家人坐波音飞机。”他给波音高管写邮件,但完全被无视,波音仍继续运营737生产线,以超越其竞争对手空客。

2020年3月-4月华为开发者大会HDC.Cloud上,华为网络人工智能(NAIE)论坛将在线上直播,欢迎大家关注公众号【网络人工智能园地】,点击菜单【HDC】,接入我们的直播和专家线上探讨交流!

现在使用华为云账号登录华为云,选择NAIE服务(路径:EI企业智能―智能体―网络智能体 NAIE),再从AI服务目录选择数据集服务,即可进入数据集服务页面选择所需公开数据集(https://www.hwtelcloud.com/products/dsi)。

11月,美国联邦航空管理局宣布,为了维持核发适航性证书的权威,未来所有737 MAX新机的适航性证书,都将仅由FAA核发。

曾在FAA从事安全监管工作的航空安全专家迈克尔·德雷科恩表示:“波音公司和联邦航空管理局简直就是共生关系,二者之间关系太密切了。”由于技术能力不足,联邦航空管理局通常依赖波音公司自己的员工来认证飞机的安全性。

9) 无线&微波故障数据集:告警数据基于无线基站、动力环境、微波等设备拓扑进行关联,利用工单数据完成根因告警标注,覆盖29种故障类型,可用于告警压缩和故障定位,样本量100w+条,特征维度46维

2018年10月,印尼狮航一架737 MAX客机发生空难,第一次为波音敲响警钟。然而,波音却没有进行任何有针对性的检查维修,来修复可能的问题。2019年3月,悲剧重演,埃塞俄比亚航空一架737 MAX客机起飞后坠毁,造成157人死亡。

资本的贪婪?赶进度,控成本

2) 性能指标变更监控测数据集:覆盖4种网络业务变更场景,包括变更成功场景和失败场景,失败场景数据有对应标签;样本量100W条,特征维度40维

2019年5月,FAA的一项内部审查曝光,初步确认该机构高级官员没参与或监督对波音737 MAX客机飞行控制系统的重要安全评估,或间接造成两起空难的发生。

4) 数据中心群控数据集:包含冷塔、冷机、泵等设备的供回水温度、压力、IT机房、冷站设备能耗100+维特征,可应用于数据中心水冷冷冻水场景制冷系统优化模型训练;样本量2W条,特征维度100维

737 MAX屡次曝出问题,也折射出了美国联邦航空管理局的监管不力。

数据和特征决定了机器学习的上限,华为发布网络领域10大数据集,不但可以帮助网络AI开发者减少90%的数据集准备时间,更重要的是将会极大提高AI模型精度。目前已验证数据中心数据集助力AI模型达准确率达到89.77%,无线&IPRAN故障数据集提高高级聚合率到95.4%,查准率到90%。

多年蝉联全球最大飞机制造商的波音公司,为何走到了如今丑闻缠身的境地?

另外,787梦幻客机也深陷泥沼。11月,波音退休工程师约翰•巴奈特(John Barnett)实名举报,787梦幻客机的供氧系统有缺陷,一旦遇到机舱突然减压的情况,系统可能不工作。

2019年4月,波音宣布,为应对全球停飞,将737 MAX飞机减产19%,由每月生产52架调低至每月42架。

未来,怎样填补财政损失,怎样修复品牌信用,将是波音公司不得不面对的问题。

这10大数据集是华为从外场仿真数据和实验室模拟数据,经过解析治理、探索标注之后的,可以直接应用于网络领域AI应用开发的数据集。分为“异常检测类”、“控制优化类”、和“故障定界类”三大类:

8) 无线&PTN故障数据集:告警数据基于无线基站、动力环境、PTN等设备拓扑进行关联,利用工单数据完成根因告警标注,覆盖48种故障类型,可用于告警压缩和故障定位,样本量100w+条,特征维度61维

10) PON光路故障数据集:PON光路故障场景数据,包含光纤弯曲、连接器松动等故障场景,覆盖光模块的电压,电流,接收光功率,发送光功率等特征,样本量4w条,特征维度11维

五个月内发生两起空难,让波音的安全性备受质疑。事故发生后,全球近50个国家和地区先后宣布了针对波音737 MAX的停飞禁令。而针对空难的调查显示,该机型新增的“机动特征增强系统”(MCAS),在测试、审查上存在种种漏洞,使波音深陷信任危机。

美国交通部督察长卡尔文·斯科韦尔指出,联邦航空管理局的行为已经“动摇了”公众对他们的信心。

2019年上半年,埃塞俄比亚航空公司的波音737 MAX 客机空难发生后,有数名波音前员工和现职员工向FAA举报隐患。他们认为,为了赶进度、控成本,波音根本不重视安全质量。

6) 无线接入故障数据集:覆盖20种无线接入故障类型,告警数据与工单数据相关关联,业务专家团队准确标注,可用于告警压缩和根因定位类模型开发,样本量65w条,特征维度7维

737 MAX从停飞到停产,经历了什么?

1) 性能指标异常检测数据集:时间序列数据集,包括正样本和负样本,可应用于时序序列预测等算法的训练和验证;样本量100W条,特征维度7维

也就是说,FAA允许航空公司通过“自己查自己”,认证其飞机安全性,这也很好地解释了“问题飞机”为何仍能上天。

7) 无线&IPRAN故障数据集:告警数据基于无线接入和IPRAN的设备拓扑进行关联,利用工单数据完成根因告警标注,覆盖37种故障类型,可用于告警压缩和故障定位,样本量700w+条,特征维度24维

巴奈特是波音公司32年的老员工了,退休前曾在一家波音飞机制造厂工作7年,负责质量控制。他说,测试结果显示,多达四分之一的供氧系统有缺陷。他向公司高层提出了这个问题,但没有得到回应。

近日,苦苦等待复飞的波音再次接到“坏消息”。美国联邦航空管理局(FAA)宣布,737 MAX安全审核将延续到明年,多家航空公司也表示,将推迟该机型复飞时间。

停产消息传出,波音股价大幅下跌4%,其供应商的股价也应声下跌,而上万名工人则前途未卜。分析师称,737 MAX停产一季度或使美国季度GDP年化增长率降低0.3个百分点。

然而,存在问题的,还不止737 MAX。

终于,12月16日,波音决定“断臂求生”,他们将从2020年1月起,暂停737 MAX飞机的生产,以维持“长期生产系统和供应链的健康”。

3) 硬盘故障检测数据集:覆盖日立,希捷共计16款硬盘型号,累积标注坏盘数量超2300块,应用于硬盘故障预测类问题分析与研究;样本量超230W条,特征维度超100维(覆盖厂商公开SMART指标)

尽管波音公司否认了他的指控,但波音737 MAX引发的蝴蝶效应,使得波音家族其他客机的日子并不好过。每当出现事故,就被怀疑飞机系统有问题。另据统计,波音公司2019年的订单和交付量远远落后于空中客车公司。

外媒普遍认为,波音这一决定将“冲击美国经济”。

波音其他型号客机也接连出现问题。2019年9月,波音一架新型777X客机在进行压力测试时,机身破裂。

“所有迹象都表明,波音的全部重点就是将飞机推向市场。”波音737工厂前高级经理皮尔森的话,似乎使波音飞机频频出现问题有了解释。

10月,波音737 NG被曝出机体出现裂痕,美国联邦航空管理局紧急勒令排查。在全球各家航空公司的810架737 NG飞机中,总共发现38架飞机存在结构性裂痕。包括韩国、印尼在内的国家都立刻采取停飞措施。

5) 数据中心PUE优化数据集:覆盖3种制冷场景、4种末端空调、冷站群控、IT机房等设备能耗数据,基于冷却系统完成关联,应用于PUE优化、网络领域控制类模型开发与研究;样本量2W条,特征维度110维

皮尔森在国会听证会作证时表示,在2018年中旬,他所在的工厂工人严重短缺,加班率激增,工人们的错误也频频出现。然而,波音公司仍然斥责员工进度慢,敦促其加快速度,还计划将月产量从47架增至52架。