快速访问存储状况和任务

此部分介绍了用于确定系统存储组件的状况或运行状况的多种方法,以及如何快速启动可用的控制器任务。

存储控制台和存储运行状况

对于每个控制器,“存储运行状况”选项卡或“存储控制台”会显示控制器严重性(运行状况或状况)的摘要以及启动控制器任务的任务菜单。提供链接访问虚拟磁盘状况和任务。

存储运行状况

“存储控制台”显示各个控制器和低层存储组件的总状况。例如,如果存储系统的运行状况由于一个降级的机柜受到了影响,机柜“运行状况”子选项卡和“存储控制台”上的控制器严重性都会显示一个黄色的感叹号 (!) 以表示警告严重性。如果“存储控制台”上的控制器显示警告或严重状况,应执行以下操作调查警告或严重状况的原因:

单击控制器右边显示的“检查警报日志”。此链接显示警报日志。检查警报日志查找与控制器及其低层组件状况相关的警报。“检查警报日志”链接只有在控制器显示警告或严重状况时才会显示。
选择控制器并调查低层组件的状况。有关详细信息,请参阅存储组件严重性
单击处于降级状态的虚拟磁盘以显示物理磁盘属性页。
注:只有属于虚拟磁盘一部分的物理磁盘处于警告严重状态时,才会显示虚拟磁盘链接。

有关低级组件的状态如何上滚至针对控制器显示的状态中的详细信息,请参阅确定存储组件的运行状况

热备份保护策略

设置热备份保护策略任务允许设置或修改要分配给虚拟磁盘的热备份数。

设置分配的热备份数后,任何对保护策略阈值的违反都会根据设定的严重性级别触发警报。

有关详细信息,请参阅设置热备份保护策略

选择报告

选择报告选项提供以下报告:巡检读取、一致性检查和插槽占用。有关详细信息,请参阅巡检读取报告检查一致性报告插槽占用报告

存储组件严重性

组件状况由严重性来表示。需要立即对具有“警告”或“严重/故障”状况的组件加以关注,以防止可能的数据丢失。组件的状况可能表示组件及其低层对象的总状况。有关详细信息,请参阅确定存储组件的运行状况

查看事件警报日志有助于找出那些说明组件为什么出现“警告”或“严重”状况。有关其他故障排除信息,请参阅故障排除

表 4-1. 组件严重性

严重性

组件状况

正常/良好—组件按照预期工作。

警告/不严重—探测器或其他监测设备检测到组件的读数超过或低于可接受级别。组件可能仍在工作,但可能会造成故障。组件还可能会在不稳定的状态下工作。可能会出现数据遗失。

严重/故障/错误—组件已出现故障或即将出现故障。组件需要立即进行检查并且可能需要更换。可能已经发生数据遗失。

  存储属性和当前活动

“配置/信息“子选项卡显示关于存储组件的信息。这些属性包括一些详情,比如控制器上的连接器(信道或端口)数或机柜管理模块 (EMM) 固件版本。

“状态”和“进度”属性表示组件的当前活动。例如,脱机物理磁盘显示“脱机”状况,而“进度”属性显示还有多久就可以完成操作(比如重建)。

以下部分介绍各个组件的属性:

存储信息和全局任务
控制器属性和任务
电池属性和任务
连接器属性和任务
机柜和背板属性及任务
物理磁盘或物理设备属性和任务
EMM 属性
风扇属性
电源设备属性
温度探测器属性和任务
虚拟磁盘属性和任务

警报或事件

存储活动会生成警报或事件,这些警报或事件将显示在“警报日志”中。有些警报表示正常的活动,只是为了提供信息而显示。其他的警报则表示异常的活动,需要立即进行处理。有关警报及其纠正措施的详细信息,请参阅 support.dell.com/manuals 上的《Dell OpenManage Server Administrator 消息参考指南》

监测 RAID 控制器上的磁盘可靠性

Storage Management 在已启用 SMART 的物理磁盘上支持自我监测分析和报告技术 (SMART)。

SMART 会对每个磁盘执行预测故障分析,并且在预计会发生磁盘故障时发出警报。RAID 控制器会检查物理磁盘以寻找预计的故障,如果找到,就会将此信息传递给 Storage Management。Storage Management 会立即在磁盘上显示一个警报图标。Storage Management 还会将警报发送到警报日志和 Microsoft Windows 应用程序日志。

注:当控制器的输入/输出暂停时,您收不到 SMART 警报。
注:对于未分配的磁盘或热备份磁盘,PERC 4/SC、4/DC、4e/DC、4/Di、4e/Si 和 4e/Di 控制器不报告 SMART 警报。

相关信息:

更换收到 SMART 警报的物理磁盘

使用警报检测故障

有些存储组件具有警报。启用后,这些警报会在组件失败时提醒用户。有关详情,请参阅以下部分:

启用警报(控制器)
启用警报(机柜)

使用机柜温度探测器

物理磁盘机柜带有温度探测器,在机柜超过允许的温度范围时会警告用户。有关使用温度探测器的详情,请参阅以下内容:

SMART 热关机
设置温度探测器值

  重新扫描以更新存储配置更改

“重新扫描”任务扫描连接到控制器连接器(信道或端口)的存储设备,以验证当前连接的设备或识别连接器上已添加或卸下的设备。对控制器对象进行重新扫描时,所有连接到控制器的存储都将重新扫描。执行重新扫描会使控制器识别出存储配置中的更改,比如虚拟磁盘添加或卸下了物理磁盘,或者更改了 RAID 级别。

可能想在以下情况进行重新扫描:

要了解控制器上连接的新磁盘。
要让操作系统识别虚拟磁盘。
要让 Storage Management 显示新虚拟磁盘。
扩充虚拟磁盘后,可能需要重新扫描控制器以便虚拟磁盘可以使用多余的磁盘空间。
要更新脱机磁盘的状况。
要在群集资源故障转移后显示群集配置中的更新信息。
注:对于基于 SCSI 控制器的系统,如果要重新扫描所有控制器,可以执行全局重新扫描中的步骤。如果仅要重新扫描连接到某个控制器的组件,可以执行重新扫描控制器中的步骤。
注:单击右窗格中的“刷新”按钮仅刷新右窗格。要在左窗格树形视图中查看新的物理磁盘,请单击左窗格顶部显示的系统名称,或从浏览器的菜单栏中选择“视图”→刷新

相关信息:

用于检测物理磁盘状况更改的输入/输出和重新引导要求
显示配置更改的时间延迟

  显示配置更改的时间延迟

更改存储配置时,Storage Management 会迅速生成 SNMP 陷阱以响应配置更改。Storage Management MIB(管理信息库)也会更新以反映存储配置更改。但是,可能需要花多达五分钟来使用最新的存储配置更新 MIB。因此,在接收 SNMP 陷阱和能够通过查询 Storage Management MIB 来识别配置更改的过程之间会有最多五分钟的时间延迟。在 RAID 1 连锁虚拟磁盘上创建新虚拟磁盘或执行取消镜像或分割镜像时,这种时间延迟尤其明显。可以通过执行控制器重新扫描来尽量缩短这种延时。有关详细信息,请参阅重新扫描控制器

  用于检测物理磁盘状况更改的输入/输出和重新引导要求

此部分适用于 PERC 4/SC、4/DC、4e/DC、4/Di、4e/Si 和 4e/Di 控制器

由于硬件限制,直到尝试输入/输出或系统重新引导后,PERC 4/SC、4/DC、4e/DC、4/Di、4e/Si 和 4e/Di 控制器才检测物理磁盘状况变化。

如果控制器具有到磁盘的打开的通信路径,则在控制器上执行 I/O 操作会更新磁盘状况。例如,如果未配置的磁盘已被卸下,则在手动扫描完成或尝试其他输入/输出操作之前,控制器不会检测到更改。与此类似,要显示虚拟磁盘或其中一个物理磁盘的状况变化,需要在虚拟磁盘所在的控制器上执行输入/输出操作。

但是,如果控制器已失去通信路径,则需要重新引导系统才能更新磁盘状况。如果在尝试访问数据时操作系统生成 I/O 错误则说明通信已失去,即使 Storage Management 显示磁盘状况为运行良好。通信路径一旦恢复,则重新引导系统以更新磁盘状况。如果通信路径没有恢复,则 Storage Management 在重新引导后不会显示存储对象。

相关信息:

重新扫描以更新存储配置更改