搜档网
当前位置:搜档网 › 阿里云监控体系现状概览

阿里云监控体系现状概览

阿里云监控体系现状概览
阿里云监控体系现状概览

本文根据InfoQ中文站跟阿里云产品技术部产品总监马劲的在2014年10月初的一次电话交流整理而成,褚霸对本采访内容亦有所贡献。在本次沟通中,马劲对阿里云监控体系的现状进行了简单介绍,涉及到监控的覆盖面、监控粒度、故障识别、OpenAPI的开放进度等方面。

嘉宾简介

马劲,花名竹蜓,来自阿里云产品技术部,是阿里云四大主题(云服务器,存储和多媒体、数据平台、中间件)的产品总监之一,负责阿里云所有中间件产品管理,目前负责管理的产品有OCS(缓存)、MQS(消息队列)、ACE(云引擎)、ESS(弹性扩展)、PTS(性能测试)、Open Search(开放搜索)、ONS(开放消息服务)、云监控。竹蜓之前在IBM 有13年工作经历,曾经担任云计算软件全球产品总监、大中华区软件VIP客户服务总监、大中华区软件培训负责人、攻城狮、程序猿等多个职位。

背景概述

监控体系是云计算基础架构最重要的组成部分之一。阿里云监控体系有两个视角:运维自己的集群监控体系,由技术保障部主导;以及用户视角的监控产品(如云监控服务),由产品技术部主导。运维的工作着眼于掌握每个服务的可用性、可靠性数据,提升发现问题解决问题的速度;客户的需求则是可以方便的看到自己阿里云资源的状态,包括资源的稳定情况和资源消耗情况等,以及客户基于阿里云的应用的状态,例如应用是否可用,性能如何。

当然,无论是何种角度的监控,底层基础架构是共享的。

过去一年主要完成的相关工作包括:

?为阿里云的各个产品逐步建立全链路监控,完成对所有服务各个模块端到端的数据采集(运维视角)

?在2014年4月开始“云监控”产品的公测,目前包含站点监控、ECS监控以及自定义监控。ECS的CPU、内存、IO、存储等资源的状态,现在所有人都可以通过API项获取(用户视角)

?RDS、SLB在“云监控”上的接入正在实现当中(用户视角)

RDS的监控

褚霸:RDS全链路监控现在基本都做完了。RDS较早做到全链路监控,是因为用户对数据库的QPS和RT变化非常敏感,倒逼着我们对系统更深入把控。

这就要求我们能够从网络(交换机)、操作系统、LVS、中间层、数据库整个链路能够从用户的视角收集到详尽的数据,通过流计算平台聚合、对比来看到异常,先于用户发现变坏的趋势,在更短的时间内做出响应。

全链路是个麻绳,需要整个链条上的每个部件都暴露出足够多的信息(特别是用户触发的行为动作),透过这个麻绳串起来。比如说RDS中间层统计数据在内存中按照树状组织的,基本上所有的内部模块都有详细的运行状态,日志和诊断代码在中间层中占比达到30%。

这些状态都在内存中,抓取统计数据的代价是恒定的,精细到每个用户的链接,再聚合成用户级别,主机级别,集群级别在监控系统界面上关联展现,指标超过150个,基本可以做到白盒,对系统的运行了如指掌。

监控粒度

ECS上的CPU争抢情况已经按秒级采集数据,而对于IO访问的访问请求监控是更细粒度,统计到每个IO访问的响应延时。

监控的目的提供稳定的服务,在出了问题以后能尽快处置,即使做到十毫秒级,如果还是基于事件,问题报警,也是事后诸葛亮。监控希望能做到事前分析与预测,所谓后发先至,避免发生影响服务的事件,这本身是一个IT数据的大数据应用的课题,例如我们正在分析VM 的CPU消耗周期变化尽可能把CPU密集的VM均匀分布到不同的物理机器上,同时正在开发动态热点迁移技术进一步提高用户体验。

做到秒级不是目标,做到主动预测、主动干预化解问题,避免服务对外不可用,才是我们的目标。

故障预测

基于全链路的监控与分析平台,我们对每一次的故障进行review,将故障原因的相关指征提取出来,形成预警方法。有些故障是由软件更新的bug触发,不过bug触发的问题如果能够提取为指征,也可以回归到预警系统。另外,通过异常分析也可能找出可能未知的问题,报警让人来分析。

全链路监控与分析平台现在在RDS上得到应用已经取得不错的效果,ECS、SLB和CDN 等正在应用该平台。

弹性计算服务

阿里云正在做Elastic Scaling Service弹性计算服务,原计划8月发布,但是觉得还达不到公测的质量水平标准,所以有所延迟,预计近期(10月)会推出邀请测试。

第三方监控服务

其实公测阶段的云监控产品目前还不太完善。比如ECS实例监控,现在还需要客户手动下载安装Agent,这对于ECS服务器数量多的客户是工作量很大的,可以做得更加自动化。

阿里云的云监控会提供更多服务,同时也欢迎第三方能够针对阿里云开发一些高级的监控。目前市场上已经有客户自己安装了第三方监控可以在阿里云上使用,包括商业监控软件和开源监控软件对阿里云资源的监控,也有客户自己订阅了监控SaaS服务来监控他们跑在阿里云上的应用,包括一些国外的SaaS监控(如New Relic)。

阿里云的云监控提供OpenAPI,目前已经在针对小部分可信用户进行内测。内测资格目前只有经过单独审批才能拿到,主要针对企业客户。因为API涉及到权限、流量等安全因素,

所以这方面会非常谨慎的逐步公开,一方面要借助内测用户的尖锐批评来改进,减少bug、提升用户体验,另一方面也需要把文档更加完善起来,具体的时间表尚未确定。

总结

阿里云是非常技术的产品,但归根结底是为了让客户用的爽,解决客户的问题。阿里云总裁菲青经常带阿里云的管理者去跟客户沟通,管理者也被鼓励尽量带着一线员工出去了解客户。现在每次阿里云发新的feature之前,产品经理都会先把demo发到客户群里,这样在上线之前就能收集到部分反馈。今年9月初,阿里云管理者大会上搞了“火线24小时”的活动,

全员自由组了几十个队伍去研究客户工单,在24小时内针对工单内容设计解决方案,最后选拔出来的8支队伍提供的方案在大会上讲演之后立刻往下迭代,不需要立项、审批、排期。这样的活动还会不定期的搞下去,只要客户有问题,阿里云就有动力持续的努力解决。

做阿里云,技术上固然有很多挑战,但最大的挑战还是对客户的理解。因为业务是很丰富的,比如客户提一个要查看某一个监控项比如缓存命中率的需求,我技术上实现不难,但做出来的东西未必是客户想要的,客户可能查看数据主要的目的是找到应用出了什么问题,具体观察的时间,观察到以后如何处理。唯有真的去客户那里和客户交流,深入了解客户使用的场景,了解客户的痛点,才能做出真正满足客户需求的服务。

工单,论坛都是是很重要的产品改进输入,我们的产品经理和管理者会认真看工单,不断转化为产品改进。恳请大家把您的问题告诉我们,“向客户学习,陪伴客户成长”是我们的理念。

【QCon北京2015大会】把握趋势,邀请国内外顶级专家,设计涵盖大数据、云计算、移动开发、技术创业、前端和敏捷等热点领域的18个专题,IT领域的技术盛宴。了解详情。

阿里云AppDeploy使用手册

阿里云AppDeploy使用手册 阿里云– CTO Office –开发者效率团队 2015.08 版权所有侵权必究

目录 1 介绍 (3) 2 功能 (3) 3 安装 (4) 4 使用说明 (6) 4.1 获取、设置Access Key (7) 4.2 环境变量 (8) 4.3 执行命令 (9) 4.4 并发执行 (10) 4.5 文件传输&远端执行&一键更新源 (11) 4.6 Web环境安装、应用打包部署 (12) 5 最佳实践 (13) 5.1 Hello World (14) 5.2 Nginx 远程部署 (15) 5.3 Shell脚本文件执行 (17) 5.4 一键环境安装、应用编译打包发布 (18) 6 常见问题 (19)

1 介绍 阿里云AppDeploy是一个通过SSH实现的流式命令行工具,可用于完成应用部署和远程系统管理,其工作于python2.5-2.7平台上,具有良好的可移植性;AppDeploy将本地应用软件上传到远端服务器,并通过执行用户预定义的产品部署命令,灵活的、便捷的、高效的为阿里云用户实现应用远程部署提供稳定的工作环境。 AppDeploy使用自然语言对部署任务进行描述,通过简单的编辑规则,您可以像书写自然语言一样描述您的部署任务,AppDeploy将依据您写的自然语言描述文件部署、管理您的应用。 2 功能 1)远程应用部署:用户可以使用AppDeploy将本地应用软件安装部署到远程云服务器上, 软件包可以在本地编译打包好,也可以选择在云服务器编译安装。 2)远程服务管理:您可以使用AppDeploy远程执行shell脚本,让远程机器的操作命令感 觉在本地执行一般,大大的提高开发者的工作效率。 3)文件上传下载:您可以在本地主机和远程服务器间实现上传、下载文件的功能。 4)同时控制多台服务器:基于大型软件的部署场景,AppDeploy提供同时在多台服务器部 署软件的功能,且可以选择顺序执行或者并发执行的运行模式。 5)一键环境安装:一键安装Web运行环境,支持JDK、Nginx、Apache、Tomcat、PHP、 Mysql等多版本,您可以根据业务选择安装; 6)一键应用部署:可以一键编译、打包、部署常见的应用,支持Maven、Ant等打包部署 的安装方式; 7)一键式更新源:执行AppDeploy自定义命令更新系统源,支持Ubuntu、Centos、Redhat、 Opensuse、Debian等系统的主流版本; 8)账号密码管理:基于用户复杂的应用场景,为用户提供灵活、易用的账号密码管理功能, 用户可以设置免密码输入运行,且可为不同主机设置不同密码。

阿里云-Web应用防火墙使用手册

Web 应用防火墙使用手册

----- 使用手册 简介 启用"Web应用防火墙",需要您在DNS服务商处为域名添加或修改CNAME记录,将域名指向"Web应用防火墙",从而达到Web防护的效果 操作步骤 1. 获取加速域名 在"Web应用防火墙"找到生成的CNAME 2. 变更DNS解析,接入"Web应用防火墙" (以万网DNS为例) 登录万网会员中心 点击会员中心左侧导航栏中的【产品管理】-"我的云解析"进入万网云解析列表页。点击要解析的域名,进入解析记录页。 进入解析记录页后,点击新增解析按钮,开始设置解析记录。 记录类型选择为CNAME,主机记录填写对应的子域名(如https://www.sodocs.net/doc/a81821516.html, 的主机记录为: www)。记录值填写"Web应用防火墙"对应域名的cname

-- -TTL为域名缓存时间,您可以按照您的需求填写,参考值为3600填写完成后,点击保存按钮,完成解析设置 注意事项 同一个主机记录,CNAME解析记录值只能填写一个,您可以修改为"Web应用防火墙"的地址 同一个主机记录,A记录和CNAME记录是互斥的,您可以修改为CNAME类型,并填入CNAME 如果DNS服务商不允许直接从A记录修改为CNAME记录,需要您先删除A记录,增加CNAME记录 ,注意删除新增过程需要快,如果删除后,长时间没有添加CNAME值,可能导致域名解析不到结果 同一个主机记录,MX记录和CNAME记录是互斥的,如果您必须保持MX记录,可以将用A记录方式指向WAF的IP,WAF的IP获取可以采取:ping 一下 cname,得到的IP即为WAF IP。直接配置 A 记录,记录值写此IP Web应用防火墙简介 Web应用防火墙(Web Application Firewall, 简称 WAF)基于云安全大数据能力实现,通过防御SQL注入、XSS跨站脚本、常见Web服务器插件漏洞、木马上传、非授权核心资源访问等OWASP常见攻击,过滤海量恶意访问,避免您的网站资产数据泄露,保障网站的安全与可用性。 Web应用防火墙是针对单个域名提供安全防护的产品,接入前后对比如下图: 接入准备 以https://www.sodocs.net/doc/a81821516.html,和https://www.sodocs.net/doc/a81821516.html,为例:

云OS系统新手使用指南,阿里云系统如何使用

云OS系统新手使用指南,阿里云系统如何使用 此教程适合刚刚入手阿里云系统的同学。 如何下载应用程序? 答,方法有很多, 1,可以使用手机浏览器直接在线下载应用并安装到手机,大家可以直接百度扒弎网有更多详细教程。 2,可以使用阿里手机操作系统自带的应用中心来搜索应用并下载安装 3,可以使用电脑端的手机管家连接手机进行软件应用的安装与管理. 4,可以直接复制apk文件(安卓系统的应用软件格式)到手机,然后通过手机的文件管理进行安装. 是否兼容安卓应用?比如千牛安卓版,谷歌地图 对于常规的安卓应用是支持的,详情请见: 对于谷歌服务是不支持的,如google+ gmail 等 阿里手机操作系统均有可以替代的产品 阿里手机操作系统和安卓区别在哪? 云OS并非Android,有自己独立的应用运行环境和另外的生态系统支持 阿里手机操作系统是阿里巴巴公司研发的一款新型智能手机操作系统,该系统搭载了阿里云公司自主设计、架构、研发的系统核心虚拟机,增强了云端服务的能力,并提供与Dalvik虚拟机兼容的运行环境。通过海量云空间来同步和管理手机数据,数据可永久保存在云端并连通所有设备。基于云端弹性云计算的托管服务,便于开发者快速开发和部署移动应用,该系统兼容市面上绝大部分现有的安卓应用程序. 如何把图标从一屏拖动到另一屏

解决方法:第二页的图片先得空出来一个坑位,然后长按第三页的图标往左侧边上拖动停留一下就过去了 想换成阿里手机,但是如何把以前手机的通讯录导入阿里手机呢? 解决方法:使用第三方app就可以完成,如微信里的通讯录安全助手等,在老的手机上备份在新的手机上同步一下即可 手机如何连接wifi? 答:用wifi上网:设置→WLAN(打开)→WLAN设置→在WLAN网络里选择你要连接的网络→输入密码→连接,连接成功后在手机屏幕上方会显示相应的标识,如果还是不能够正常上网请检查WLAN网络 怎么判断手机是在用WIFI流量还是手机卡流量呢? 答:当您的手机连接上WIFI网络后,你的数据网络标示会自动隐藏,WIFI网络图标会出现在手机状态栏,此时网络流量为WIFI,只有在断开WIFI后才会使用手机数据流量,此过程自动切换,无需手动操作. 阿里手机是否支持便携式无线热点功能? 答:支持的,使用方法,首先开启手机的数据网络,然后打开系统设置--移动网络设置--便携式热点,勾选开启,也可以更改便携式热点的配置,网络SSID,加密方式,以及密码等.设置完成后具有WIFI无线网络功能的终端,如智能手机,平板,笔记本电脑等设备即可连接阿里云手机实现网络共享。 阿里手机支持哪些音乐格式? 答:阿里云手机支持MP3、WMA、AMR、ACC、ASF、OGG等主流音乐格式,

阿里云-性能测试使用教程

性能测试 性能测试视频教程

性能测试视频教程 培训课程介绍 课程主要分为初级、中级、高级,适用于不同水平的客户;初级课程目标是熟悉性能测试基本概念以及压测工具使用;中级课程目标是掌握性能测试中关键核心技术,完成性能测试相关工作并能进行初步的性能分析;高级课程目标是精通性能测试各环节内容,流程化及规范化性能测试;熟悉性能分析及调优;提前解决和预防生产环境性能问题。 视频教程如下: 访问性能测试控制台 初级课程 性能测试基本概念 性能测试基本概念课程主要介绍性能测试的定义,各种性能测试专业术语以及性能测试类型。 视频教程如下: 访问性能测试控制台 性能测试基本功能介绍 性能测试基本功能介绍,主要介绍性能测试测试环境管理、测试脚本设计、测试场景设计、测试任务设计和测试结果查看等。 视频教程如下: 访问性能测试控制台 性能测试/性能测试视频教程

中级课程 性能测试基本流程 性能测试基本流程主要介绍进行性能测试必要的流程以及每个流程需要做什么等。 视频教程如下: 访问性能测试控制台 性能测试核心技术 性能测试核心技术主要介绍性能测试实施过程中涉及到的环境、业务模型、测试模型、测试指标、测试场景等核心技术。 视频教程如下: 访问性能测试控制台 性能测试中级功能使用 性能测试中级功能使用主要介绍如何进行脚本设计、场景设计以及任务设计等。 视频教程如下: 访问性能测试控制台 测试结果初步分析 测试结果初步分析主要介绍根据性能测试展示的相关指标,如何进行性能分析。 视频教程如下: 访问性能测试控制台 对象存储 OSS/周边工具

阿里云-云盾用户手册

云盾用户手册 suddy Alibaba Group Aug 29,2013 18-19/F, Xihu International Building, 391 Wen Er Road, 杭州, 浙江 , 310013, suddy

目录 进入云盾控制台 控制台首页 服务详情-防DDoS服务详情服务详情-主机密码防暴破 服务详情-网站后门详情 服务详情-异地登录详情 服务详情-网站安全防御 服务详情-防火墙管理 服务详情-端口安全检测 服务详情-WEB漏洞检测 服务详情-网页木马检测

进入云盾控制台

登录阿里云管理控制台,选择产品列表-》云盾进入云盾控制台 控制台首页 控制台首页主要展现当前您所属的云服务器的整体安全情况(需要开启云盾服务)。 其中: 安全事件区:主要展示当前用户云服务器需要处理的安全事件,包括但不限于需要处理的漏洞/网站后门/异地登录事件等一些安全事件。主要包括以下几种: WEB漏洞:用户可以点击“开启网站安全防御”开启防御服务,直接拦截恶意入侵者的WEB攻击,也可以选择“查看详情”,查看具体的漏洞并进行修复。 网页木马:展现当前用户所属云服务器上存活的网页木马情况,用户可以点击“查看详情”,查看具体的网页木马地址并进行修复。

异地登录:展现当前用户所属云服务器异常登录的情况,用户可以选择“确认”,确认本次异常登录是本人行为,也可以点击“修改密码”到对应的主机密码修改页面进行修改。 密码暴力破解:展现用户在最近7天内的服务器密码被暴力破解成功事件。用户可以点击“修改密码”修改服务器密码进行规避。 网站后门:展现当前用户所属主机的待处理网站后门。用户可以点击“查看详情”查看具体的后门并进行删除/忽略等管理操作。 安全概况区域/安全评分区域:展现当前的该用户所属主机的总体安全情况。

阿里云-日志服务计费说明

日志服务计费说明

1.2.1.2.3.4. 计费说明 日志服务计费规则 日志服务对LogHub、LogSearch两个功能收费,LogShipper功能免费。 LogHub 计费项 注意: 读写流量根据传输大小计算(默认为压缩后大小),日志一般有5-10倍压缩率,原始日志为10GB/天,实际压缩大小为1.5GB,则以1.5GB计费。 Shard租用只统计当前读写Shard数量,例如目前有3个Shard:1个Shard状态为读写,另外2个Shard已经被合并为只读,则当前只收取1个Shard租赁费。因此已经被合并/分裂的Shard不收取租用费。 说明: 为什么Shard要收费? Shard是用户标准化读写单元,当用户创建Shard后,我们能并保证该部分服务能力。 流量超过Shard能力时怎么办? 尽可能服务,但在繁忙时会优先保证Shard预留部分服务。 Logtail写入流量如何收费? 与API方式相同,Logtail内部采用最优的传输策略并自带压缩,能够在保证延时情况下批量发送。 我们提供监控数据帮助用户判断具体流量大小。 计费例子 我的网站一天有1亿API请求,一个请求对应200字节日志,一天日志数量为20GB,高峰时流量为均值5倍,则峰值流量为1.16MB/S (<5MB/S)。这些日志每天被读取一遍做实时计算,并导入到OSS中进行备份。

--q q q --------需要预留一个Shard,0.04 元/天读写流量: 写入流量为20GB,假设压缩率为10, 实际流量为2GB,2 * 0.2 = 0.4 元实时计算读取流量和写入流量相同,0.4 元导入OSS部分免费 百万次请求:0.12 元 (使用Logtail自动做批量发送,产生100W次写) 一天费用为 0.04 + 0.4 * 2 + 0. 12 = 0.96 元 LogSearch(原SLS功能)计费项 LogSearch为附加功能,用户可以通过开启索引进行日志查询与分析,计费项为索引流量,对于每GB的数据,在写入时一次性收取存储费用(对不同周期索引流量费用如下) 换算成每GB每天的存储价格为 计费例子 我的网站一天有100W API访问,一个请求对应200字节日志,200MB,保存最近30天进行查询 索引全部字段:一天流量为200MB,一天费用为 1.5 * 0.2 = 0.3 元 索引部分字段:用户索引ErrorCode, URL两个字段,占总长度50%,一天费用为 0.3 * 0.5 = 0.15 元 成本、使用与扣费 价格优势 LogHub:以购买云主机+云磁盘搭建Kafka相比,对于98%场景下用户价格有优势。对小型网站而言,成本为kafka 30%以下 LogSearch:以够买云主机+自建ElasticSearch相比,成本为自建70%以下 有Restful API,可以直接针对移动设备提供数据收集功能,节省了日志收集网关服务器的费用免运维,随时随地弹性扩容使用

【精】IBOS阿里云特别版OA系统使用教程(全篇)

【精】IBOS阿里云特别版OA系统使用教程(全篇) 2015年IBOS联合阿里云推出了一个特别版OA系统,支持一键安装部署在阿里云服务器,为企业省下大量前期安装部署费用。该版本支持第一年免费50用户的使用,直接进入IBOS阿里云购买页面点击购买即可免费开通。 下面分享一下IBOS开通、安装到使用的一个具体操作,大家要仔细看一下哦~ 1).登陆阿里云用户中心,点击管理控制台进入 2)进入阿里云用户中心后,点击“云市场”进入 3)进入云市场后,点击“已购买的服务”

4)在已购买的服务中,找到IBOS阿里云特别版产品,点击该产品右方的“管理”进入,就可以看到IBOS的前台和后台地址 5)点击前台地址就可快速进行安装 6)点击前台地址进入安装页面,可以看到“是否关联酷办公”的选项,酷办公是IBOS的移动端和即时沟通工具IM PC客户端;需要在酷办公中绑定OA地址才能良好运用手机移动端;此处点击“立即关联”可快速绑定酷办公账号,如果还没有注册酷办公需先点击“立即注册”后再绑定

7)阿里云特别版安装时默认设置管理员账号为本人手机号,如果此处绑定了酷办公,那么在该页面的管理员账号会直接默认为酷办公手机号;此时设置的手机号和密码就是后期登陆OA系统的管理员登陆账号和密码;企业代码就是类似企业的英文名,例如博思协创的企业代码就是IBOS;阿里云特别版不支持修改数据库用户名和密码,支持安装时请保留抱人数据库信息,然后点击下一步进行安装 未绑定酷办公安装页面:

绑定酷办公后的安装页面:

8)安装完成即可登录OA系统进行使用。接下来,我来分享一下关于酷办公绑定的操作细节,首先登陆OA地址后台,点击“绑定”-“酷办公绑定”,如下图所示,有酷办公账号的可直接登陆,没有的 用户可登陆酷办公PC端地址进行注册

阿里云-云监控用户手册

云监控用户手册 ——Version: 0.1 一、概览 在概览页面中展示中系统默认提供的监控项或者用户创建的监控项、用户创建的监控点、云服务的实例数、用户设置的报警规则等。 1.1 名词解释 先介绍下云监控三个核心的概念。 【监控项】:用户设置或者系统默认的监控数据类型,例如站点监控的Http监控默认有两个监控项http.responseTime & http.status。ECS的监控项有CPU利用率、内存利用率等等。 【监控点】:某一实例绑定到具体的一个监控项即为一个监控点。如针对 https://www.sodocs.net/doc/a81821516.html,这个站点的http监控,实际包含两个监控点http.response & http.status。对于ECS云主机有11个监控项,所以一台云主机默认有11个监控点【报警规则】:用户在监控点上设置规则,当满足条件时会触发报警

1.2 短信使用情况 云监控默认为每位用户提供1000条免费的报警短信。在概览中,用户可以查看已经使用的短信数。

二、站点监控 站点监控可以对目标站点服务的可用性以及响应时间进行监控。系统已经默认预置了8种监控类型,包括http监控、ping监控、tcp监控、udp监控、DNS监控、pop监控、smtp监控、ftp监控。其中每种监控类型里面包含了两个监控项:status和responsetime。 单击列表页面的某一行,可以显示缩略图,可用性缩略表显示的是一天内的可用性展示,响应时间缩略图展示的是近1小时内的响应时间曲线,不代表当前状态。可用性和响应时间缩略图均是统计数据,不代表监控站点的最新状态。

2. 选择您要创建的“监控类型”,点击某一“监控类型”链接进入监控点创建页面; 3.进入创建监控点的表单页面;

阿里云监控使用手册

云监控使用手册

使用手册 产品介绍 云监控简介 云监控作为云服务的监控管理入口,能让您快速了解各产品实例的状态和性能。云监控从站点监控、云服务监控、自定义监控三个方面来为您提供服务。通过云监控管理控制台,您可以看到当前服务的监控项数据图表 ,清晰了解服务运行情况。并通过设置报警规则,管理监控项状态,及时获取异常信息。 如果您已经开通了阿里云相关产品(ECS云服务器、RDS关系型数据库等),那么您可以直接登录云监控控制台,查看相关实例的监控状态(ECS需要一键安装云盾插件)。目前我们为您提供8种云服务监控,其他云服务监控近期也将接入云监控,敬请期待。 如果您需要了解自己的站点可用性和响应时间,可以开启云监控站点服务来获取站点的可用性和响应时间。站点监测既可以监测ECS服务器上的站点,也可以监测非阿里云服务器上的站点。在站点监测栏中添加监测站点,并选择需要的监控项,便可成功开启站点监测功能。 如果云服务监测和站点监测依然满足不了您的监控需求,您还可以安装云监控SDK,自定义监控项。自定义监控项信息同样可以以图表的形式展示在云监控控制台。我们为您提供了详细的自定义使用文档 获取监控信息分为两种方式,登录云监控管理控制台直接查看信息和调用OpenAPI获取监控数据信息。 云监控控制台模块包括一下 名词解释

名词解释 这些名词是云监控的关键概念。 【监控项】: 用户设置或者系统默认的监控数据类型,例如站点监控的Http监控默认有两个监控项 http.responseTime & http.status。ECS的监控项有CPU利用率、内存利用率等等。 【监控点】: 监控项的一个实例。如针对https://www.sodocs.net/doc/a81821516.html,这个站点的http监控,实际包含两个监控点 http.response & http.status。对于ECS云主机有11个监控项,所以一台云主机默认有11个监控点。 【维度】: 定位监控项数据位置的维度,例如磁盘IO这个监控项,通过实例和磁盘名称两个维度可以定位到唯一的监控点位置。 在自定义监控中,目前维度用“字段信息表示”。 【规则】: 规则是一个条件; 例如“CPU使用率>=50%”是一个规则; 10台ECS服务器中有7台可用也是一个规则,“可用服务器比例>=70%”。 【事件】: (本版本中“事件”是隐性的,没有展现给使用者) 当一个监控点上,规则条件满足时,产生一个事件。例如CPU使用率达到60%,满足“CPU使用率>=50%”这一规则的条件,则产生一个事件。 多个事件满足一个规则的条件,可以产生一个新的事件。例如站点监控由两个探测点,只有一个探测点探测到目标站点不可用,不满足“不可用探测=2”规则,不产生“双探测不可用”事件,不会触发报警。只有两个探测点同时探测某一站点不可用,产生一个“双探测不可用”事件,进而触发报警。 【事件级别】:(本版本中“事件级别”没有展现给使用者) 事件的影响分级。 可以通过严重程度来划分,不同的级别报警通道不同。 可以通过已知处理方法和未知处理方法来划分,已知处理方法的时间可以自动处理 ,未知处理方法的通知联系人人工处理。 【报警】: 由事件驱动的一个通知动作,通过特定形式通知报警联系人或服务。 【报警联系人】: 报警消息的接收人,包含手机、旺旺(淘宝)、邮件。 【报警组】: 一组报警联系人,可以包含一个或多个“报警联系人”。在报警设置中,均通过“报警组”发送报警通知。对应每一个监控点,根据预先设定的报警方式在到达报警阈值时向报警组成员发送报警消息。 【报警方式】: 异常通知用户的手段。包括短信、旺旺、邮件等。 快速上手 快速开始 快速开始 当您进入云监控控制台后,您会看到在页面的顶端看到 概览,站点监控,云服务监控,自定义监控,报警联系人,5个页面信息 初次使用,您可以先浏览一下名词解释,对云监控产品的一些关键概念的术语有所了解。 初次使用,请您先进入报警联系人 输入您的报警联系人和报警组信息,后面定义报警规则的时候会用到。 然后,您可以进入站点监控,为您需要监控的站点新建监控项。 进入云服务监控,查看您已开通的云服务的使

阿里云API网关服务-使用手册

API 网关 使用手册(开放API)

1.2.3.4.7. 使用手册(开放API) 提供API API网关(API Gateway),提供高性能、高可用的API托管服务,帮助您对外开放您部署在ECS、容器服务等阿里云产品上的应用,为您提供完整的API发布、管理、维护生命周期管理。您只需简单操作,即可快速、低成本、低风险的开放数据或服务。 在API网关您可以: 管理您的API 您可以对API的整个生命周期进行管理,包括API的创建、测试、发布、下线、版本切换等操作。 便捷转换数据 支持自定义映射规则,您可以配置映射将调用请求转换成后端需要的格式。 预设请求校验 您可以预先设置参数类型、参数值(范围、枚举、正则、Json Schema)校验,由网关帮助您过滤掉非法请求,减少您的后端对非法请求的处理成本。 灵活控制流量 您可以对API、用户、应用设置按分钟、小时、天的调用量控制。您还可以设置特例用户或者应用,对某个用户或应用单独配置流量控制。 轻松安全防护 支持Appkey认证,HMAC(SHA-1,SHA-256)算法签名。 支持SSL/TSL加密,并借助阿里云盾防病毒、防攻击。 全面监控与报警 为您提供可视化API实时监控,包括:调用量、调用方式、响应时间、错误率,并支持历史情况查询,以便统筹分析。您还可以配置预警方式(短信、Email),订阅预警信息,以便实时掌握API运行情况。 降低开放成本 为您自动生成API文档和SDK(服务端、移动端),降低API开放成本。 创建API 创建API是定义API请求的过程。您需要在创建中定义API的请求调用格式、定义网关抛向后端服务的请求格式、定义返回结果格式、定义参数校验规则等等。 定义请求的基本信息 API基本信息包括API分组、API名称、描述、API类型。

阿里云产品容灾-高可用介绍及架构方案

袋鼠云出品——阿里云高可用-容灾解决方案 这两天,一篇名为《IT之家因无法忍受阿里云而迁移至XX云》的文章引起了整个云计算行业的热议。(袋鼠云CTO江枫还专门写了一篇热评) 从目前得到的信息看,其应该是在青岛区域购买了一台云服务器ECS,基于.net和自建SQL Server,并且应用和数据库跑在同一台云服务器上。 IT之家,所有应用都部署在单台ECS上,不具备高可用的特性。 即便阿里云产品本身就有容灾、高可用的特征,但是因为一些用户对阿里云产品的不了解和自身应用架构不够合理,也根本无法使其发挥该优势。 其实,IT之家的事情不是个例,有很多其他企业在这方面很头疼。 所以,袋鼠云技术专家结合以往实践经验,总结出了一套切实可行的《阿里云高可用-容灾解决方案》,希望能和各位阿里云上用户一起探讨。 一、阿里云产品容灾-高可用介绍 1、SLB 容灾-高可用介绍 阿里云SLB产品使用开源软件LVS+keeplived实现4层的负载均衡。 采用淘宝的Tengine实现7层的负载均衡。所有负载均衡均采用集群部署,集群之间实时会话同步,以消除服务器单点,提升冗余,保证服务稳定。在各个地域采用多物理机房部署,实现同城容灾。 SLB在整体设计上让其可用性高达99.99%。且能够根据应用负载进行弹性扩容,在任意一台SLB故障或流量波动等情况下都能做到不中断对外服务。

图一 2、ECS 容灾-高可用介绍 云服务器ECS实例是一个虚拟的计算环境,包含了CPU、内存、操作系统、磁盘、带宽等最基础的服务器组件,是ECS提供给每个用户的操作实体,就如同我们平时使用的虚机。 但需要确认的是,ECS自身是没有容灾和高可用方面的功能。 所以当我们在单台ECS服务器上部署各种应用时,特别是对于那些将应用服务,数据库服务等都打包安装在单台ECS服务器时就更要注意这点了。 那ECS自身没有容灾-高可用这样的功能,对于在单台ECS上部署各种服务,一旦ECS 故障就只能眼睁睁的看着它down机对外停止服务么? 此时,如果产品自身没有容灾和高可用功能,我们可以从架构上来弥补这个短板。 比如:在应用前端购买SLB产品,后端相同应用部署至少两台ECS服务器,或者是使用阿里云的弹性伸缩技术,根据自定义ECS自身资源的使用规则来进行弹性扩容。这样即便其中一台ECS服务器down机或者资源利用超负荷,也不会使我们的服务对外终止。 ECS具备的一些优势: 稳定性:服务可用性高达99.95%,数据可靠性高达99.9999999%。

阿里云免费使用及手册

阿里云免费使用及手册 ——(免费卷领取技巧)

一、阿里云简介 (3) 二、阿里云优势 (5) 超大规模数据中心遍布全球 (5) 5大优势,助客户从0搭建到秒级部署云环境 (5) 极具竞争力的产品体系 (5) 强劲的发展速度 (6) 2016年第三季度,阿里云付费用户数量增长至 65.1 万,推动收入同比增长 130%,达到 14.93 亿元的历史新高。云计算付费用户数量同比增长 108%,覆盖金融、医疗、公共交通、能源、制造、政府机构、游戏、多媒体等行业和企业类型。在全球云计算行业,阿里云的增速已大幅领先。 (6) 三、阿里云优惠及免费(建立在实名认证的基础上) (7) 四、阿里云产品 (8) 1、弹性计算 (8) 2、存储和CDN (8) 3、数据库 (8) 4、移动云 (9) 5、安全 (9) 五、阿里云大事记 (10)

一、阿里云简介 阿里云LOGO: 阿里云(https://www.sodocs.net/doc/a81821516.html,)创立于2009年,是全球领先的云计算及人工智能科技公司,为200多个国家和地区的企业、开发者和政府机构提供服务。根据 Gartner 最新市场份额研究数据[1]显示,阿里云已成为全球前三大公共云服务提供商。2017年1月阿里云成为奥运会全球指定云服务商。截至2017年3月,阿里云付费云计算用户达87.4万。阿里云致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前已经在全球15个地域设立有数十个飞天数据中心,均部署阿里云自研的飞天操作系统,并提供中、英、日三种语言支持。 阿里云ET拥有全球领先的人工智能技术,目前已具备智能语音交互、图像/视频识别、交通预测、情感分析等技能。 ET的优势在于对全局的洞察和实时决策上,在复杂局面下快速做出最优决定。目前,ET开始在城市治理、交通调度、工业制造、健康医疗、司法等领域成为人类的强大助手。基于阿里云飞天操作系统强大的计算能力,ET的感知和思考能力正在多个领域不断进化。 飞天(Apsara)是由阿里云自主研发、服务全球的超大规模通用计算操作系统。它可以将遍布全球的百万级服务器连成一台超级计算机,以在线公共服务的方式为社会提供计算能力。从PC互联网到

阿里云高性能计算-操作指南

高性能计算操作指南

操作指南 使用流程 您在购买了高性能计算产品后,可以通过 管理控制台 找到 高性能计算 进行实例的管理。快速入口 https://https://www.sodocs.net/doc/a81821516.html,/ 。 购买HPC实例后 用户购买高性能计算实例后,对于每个实例,用户将获得以下登录信息 ECS公网IP ECS内网IP GPU物理机内网IP ECS登录账号(默认为root)和密码 GPU物理机登录账号(默认为root)和密码 首次登录之前 对于新购高性能计算实例,请修改初始化登录密码。 登录密码将作为您登录高性能计算实例的唯一凭证。 阿里云将不会以任何形式储存,因而无法提供密码找回功能。 跳转机密码需要进行重置才能登录。 初始物理机登录密码将通过站内消息发送给您,可在 消息中心 中进行查看。

重置跳板机密码 跳板机是您访问物理机前,需要首先登陆的虚拟机。随物理机所赠送。 在 高性能计算 控制台中,点击 实例 标签 选择对应的高性能计算实例的 操作 选择 跳板机, 点击 重置跳板机密码 在弹出的对话框中输入新密码,需要符合规定的密码强度 需要重启跳板机后登录密码才能生效 重置物理机密码 物理机仅能通过对应的跳板机进行访问,与其他用户之间网络完全隔离。 由于您拥有完全的访问权限,您可以在登录后输入 passwd 根据命令行提示进行修改 物理机登录密码修改后将无法由控制台进行重置 登录GPU物理机 登录方式如下: 在控制台中查看跳板机的公网 IP、内网 IP 以及物理机的内网 IP。 登录跳板机,打开终端输入ssh root@跳板机公网IP输入跳板机密码后登录到跳板机 登录到跳板机后,在终端输入ssh root@物理机内网IP输入物理机密码后登录到物理机 登录到物理机后,您将可以操作具有极致性能的 HPC 产品 首次登录之后 首次登录后,需要做如下几件事情: 修改日期时间。假设现在为2015年10月15日21:15:00,而机器日期时间与当前时间不符,则执

阿里云服务器使用手册for linux

云服务器使用手册for linux 1、远程连接服务器 (1) 2、Linux 系统挂载数据盘 (2) 3、Linux FTP服务配置 (5) 4、如何添加网站for linux(绑定域名) (6) 5、linux一键安装web环境全攻略 (7) 阿里云链接地址: https://www.sodocs.net/doc/a81821516.html,/manual?spm=0.0.0.0.KpixOR&lastSortId=234

一、远程连接Linux云服务器-命令行模式 1、远程连接工具。目前Linux远程连接工具有很多种,您可以选择顺手的工具使用。下面使用的是名为Putty的Linux远程连接工具。该工具是免费的,且不需要安装,在网上方便地下载到。 2、启动Putty.exe程序,进入Putty主界面。在Putty “Host Name”输入IP地址,在Sav ed Session中输入希望保存的名字(可以任意),点击“Save”;以后可以方便调用而不需要每次输入IP地址;点击“Open”进行连接。 3、初次运行时,会有下图中的提示,请选择“是(Y)”,下次运行就不会再出现该提示信息了。 4、请根据提示,分别输入您的Linux云服务器用户名和密码。密码不会显示在屏幕上。输入完成后回车即可。

二、Linux 系统挂载数据盘 适用系统:Linux(Redhat , CentOS,Debian,Ubuntu) * Linux的云服务器数据盘未做分区和格式化,可以根据以下步骤进行分区以及格式化操作。下面的操作将会把数据盘划分为一个分区来使用。 1、查看数据盘 在没有分区和格式化数据盘之前,使用“df –h”命令,是无法看到数据盘的,可以使用“fdisk -l”命令查看。如下图: 友情提示:若您执行fdisk -l命令,发现没有/dev/xvdb标明您的云服务无数据盘,那么您无需进行挂载,此时该教程对您不适用 2、对数据盘进行分区 执行“fdisk /dev/xvdb”命令,对数据盘进行分区; 根据提示,依次输入“n”,“p”“1”,两次回车,“wq”,分区就开始了,很快就会完成。 3、查看新的分区

相关主题