e0753bdd3bdaa171614c098e0f3a076049c7d4e8
[doctor.git] / docs / requirements / 05-implementation.rst
1 .. This work is licensed under a Creative Commons Attribution 4.0 International License.
2 .. http://creativecommons.org/licenses/by/4.0
3
4 Detailed architecture and interface specification
5 =================================================
6
7 This section describes a detailed implementation plan, which is based on the
8 high level architecture introduced in Section 3. Section 5.1 describes the
9 functional blocks of the Doctor architecture, which is followed by a high level
10 message flow in Section 5.2. Section 5.3 provides a mapping of selected existing
11 open source components to the building blocks of the Doctor architecture.
12 Thereby, the selection of components is based on their maturity and the gap
13 analysis executed in Section 4. Sections 5.4 and 5.5 detail the specification of
14 the related northbound interface and the related information elements. Finally,
15 Section 5.6 provides a first set of blueprints to address selected gaps required
16 for the realization functionalities of the Doctor project.
17
18 .. _impl_fb:
19
20 Functional Blocks
21 -----------------
22
23 This section introduces the functional blocks to form the VIM. OpenStack was
24 selected as the candidate for implementation. Inside the VIM, 4 different
25 building blocks are defined (see :numref:`figure6`).
26
27 .. figure:: images/figure6.png
28    :name: figure6
29    :width: 100%
30
31    Functional blocks
32
33 Monitor
34 ^^^^^^^
35
36 The Monitor module has the responsibility for monitoring the virtualized
37 infrastructure. There are already many existing tools and services (e.g. Zabbix)
38 to monitor different aspects of hardware and software resources which can be
39 used for this purpose.
40
41 Inspector
42 ^^^^^^^^^
43
44 The Inspector module has the ability a) to receive various failure notifications
45 regarding physical resource(s) from Monitor module(s), b) to find the affected
46 virtual resource(s) by querying the resource map in the Controller, and c) to
47 update the state of the virtual resource (and physical resource).
48
49 The Inspector has drivers for different types of events and resources to
50 integrate any type of Monitor and Controller modules. It also uses a failure
51 policy database to decide on the failure selection and aggregation from raw
52 events. This failure policy database is configured by the Administrator.
53
54 The reason for separation of the Inspector and Controller modules is to make the
55 Controller focus on simple operations by avoiding a tight integration of various
56 health check mechanisms into the Controller.
57
58 Controller
59 ^^^^^^^^^^
60
61 The Controller is responsible for maintaining the resource map (i.e. the mapping
62 from physical resources to virtual resources), accepting update requests for the
63 resource state(s) (exposing as provider API), and sending all failure events
64 regarding virtual resources to the Notifier. Optionally, the Controller has the
65 ability to force the state of a given physical resource to down in the resource
66 mapping when it receives failure notifications from the Inspector for that
67 given physical resource.
68 The Controller also re-calculates the capacity of the NVFI when receiving a
69 failure notification for a physical resource.
70
71 In a real-world deployment, the VIM may have several controllers, one for each
72 resource type, such as Nova, Neutron and Cinder in OpenStack. Each controller
73 maintains a database of virtual and physical resources which shall be the master
74 source for resource information inside the VIM.
75
76 Notifier
77 ^^^^^^^^
78
79 The focus of the Notifier is on selecting and aggregating failure events
80 received from the controller based on policies mandated by the Consumer.
81 Therefore, it allows the Consumer to subscribe for alarms regarding virtual
82 resources using a method such as API endpoint. After receiving a fault
83 event from a Controller, it will notify the fault to the Consumer by referring
84 to the alarm configuration which was defined by the Consumer earlier on.
85
86 To reduce complexity of the Controller, it is a good approach for the
87 Controllers to emit all notifications without any filtering mechanism and have
88 another service (i.e. Notifier) handle those notifications properly. This is the
89 general philosophy of notifications in OpenStack. Note that a fault message
90 consumed by the Notifier is different from the fault message received by the
91 Inspector; the former message is related to virtual resources which are visible
92 to users with relevant ownership, whereas the latter is related to raw devices
93 or small entities which should be handled with an administrator privilege.
94
95 The northbound interface between the Notifier and the Consumer/Administrator is
96 specified in :ref:`impl_nbi`.
97
98 Sequence
99 --------
100
101 Fault Management
102 ^^^^^^^^^^^^^^^^
103
104 The detailed work flow for fault management is as follows (see also :numref:`figure7`):
105
106 1. Request to subscribe to monitor specific virtual resources. A query filter
107    can be used to narrow down the alarms the Consumer wants to be informed
108    about.
109 2. Each subscription request is acknowledged with a subscribe response message.
110    The response message contains information about the subscribed virtual
111    resources, in particular if a subscribed virtual resource is in "alarm"
112    state.
113 3. The NFVI sends monitoring events for resources the VIM has been subscribed
114    to. Note: this subscription message exchange between the VIM and NFVI is not
115    shown in this message flow.
116 4. Event correlation, fault detection and aggregation in VIM.
117 5. Database lookup to find the virtual resources affected by the detected fault.
118 6. Fault notification to Consumer.
119 7. The Consumer switches to standby configuration (STBY)
120 8. Instructions to VIM requesting certain actions to be performed on the
121    affected resources, for example migrate/update/terminate specific
122    resource(s). After reception of such instructions, the VIM is executing the
123    requested action, e.g. it will migrate or terminate a virtual resource.
124 a. Query request from Consumer to VIM to get information about the current
125    status of a resource.
126 b. Response to the query request with information about the current status of
127    the queried resource. In case the resource is in "fault" state, information
128    about the related fault(s) is returned.
129
130 In order to allow for quick reaction to failures, the time interval between
131 fault detection in step 3 and the corresponding recovery actions in step 7 and 8
132 shall be less than 1 second.
133
134 .. figure:: images/figure7.png
135    :name: figure7
136    :width: 100%
137
138    Fault management work flow
139
140 .. figure:: images/figure8.png
141    :name: figure8
142    :width: 100%
143
144    Fault management scenario
145
146 :numref:`figure8` shows a more detailed message flow (Steps 4 to 6) between
147 the 4 building blocks introduced in :ref:`impl_fb`.
148
149 4. The Monitor observed a fault in the NFVI and reports the raw fault to the
150    Inspector.
151    The Inspector filters and aggregates the faults using pre-configured
152    failure policies.
153
154 5.
155    a) The Inspector queries the Resource Map to find the virtual resources
156    affected by the raw fault in the NFVI.
157    b) The Inspector updates the state of the affected virtual resources in the
158    Resource Map.
159    c) The Controller observes a change of the virtual resource state and informs
160    the Notifier about the state change and the related alarm(s).
161    Alternatively, the Inspector may directly inform the Notifier about it.
162
163 6. The Notifier is performing another filtering and aggregation of the changes
164    and alarms based on the pre-configured alarm configuration. Finally, a fault
165    notification is sent to northbound to the Consumer.
166
167 NFVI Maintenance
168 ^^^^^^^^^^^^^^^^
169 .. figure:: images/figure9.png
170    :name: figure9
171    :width: 100%
172
173    NFVI maintenance work flow
174
175 The detailed work flow for NFVI maintenance is shown in :numref:`figure9`
176 and has the following steps. Note that steps 1, 2, and 5 to 8a in the NFVI
177 maintenance work flow are very similar to the steps in the fault management work
178 flow and share a similar implementation plan in Release 1.
179
180 1. Subscribe to fault/maintenance notifications.
181 2. Response to subscribe request.
182 3. Maintenance trigger received from administrator.
183 4. VIM switches NFVI resources to "maintenance" state. This, e.g., means they
184    should not be used for further allocation/migration requests
185 5. Database lookup to find the virtual resources affected by the detected
186    maintenance operation.
187 6. Maintenance notification to Consumer.
188 7. The Consumer switches to standby configuration (STBY)
189 8. Instructions from Consumer to VIM requesting certain recovery actions to be
190    performed (step 8a). After reception of such instructions, the VIM is
191    executing the requested action in order to empty the physical resources (step
192    8b).
193 9. Maintenance response from VIM to inform the Administrator that the physical
194    machines have been emptied (or the operation resulted in an error state).
195 10. Administrator is coordinating and executing the maintenance operation/work
196     on the NFVI.
197 a) Query request from Administrator to VIM to get information about the
198    current state of a resource.
199 b) Response to the query request with information about the current state of
200    the queried resource(s). In case the resource is in "maintenance" state,
201    information about the related maintenance operation is returned.
202
203 .. figure:: images/figure10.png
204    :name: figure10
205    :width: 100%
206
207    NFVI Maintenance implementation plan
208
209 :numref:`figure10` shows a more detailed message flow (Steps 3 to 6 and 9)
210 between the 4 building blocks introduced in Section 5.1..
211
212 3. The Administrator is sending a StateChange request to the Controller residing
213    in the VIM.
214 4. The Controller queries the Resource Map to find the virtual resources
215    affected by the planned maintenance operation.
216 5.
217
218   a) The Controller updates the state of the affected virtual resources in the
219   Resource Map database.
220
221   b) The Controller informs the Notifier about the virtual resources that will
222   be affected by the maintenance operation.
223
224 6. A maintenance notification is sent to northbound to the Consumer.
225
226 ...
227
228 9. The Controller informs the Administrator after the physical resources have
229    been freed.
230
231
232
233 Implementation plan for OPNFV Release 1
234 ---------------------------------------
235
236 Fault management
237 ^^^^^^^^^^^^^^^^
238
239 :numref:`figure11` shows the implementation plan based on OpenStack and
240 related components as planned for Release 1. Hereby, the Monitor can be realized
241 by Zabbix. The Controller is realized by OpenStack Nova [NOVA]_, Neutron
242 [NEUT]_, and Cinder [CIND]_ for compute, network, and storage,
243 respectively. The Inspector can be realized by Monasca [MONA]_ or a simple
244 script querying Nova in order to map between physical and virtual resources. The
245 Notifier will be realized by Ceilometer [CEIL]_ receiving failure events
246 on its notification bus.
247
248 :numref:`figure12` shows the inner-workings of Ceilometer. After receiving
249 an "event" on its notification bus, first a notification agent will grab the
250 event and send a "notification" to the Collector. The collector writes the
251 notifications received to the Ceilometer databases.
252
253 In the existing Ceilometer implementation, an alarm evaluator is periodically
254 polling those databases through the APIs provided. If it finds new alarms, it
255 will evaluate them based on the pre-defined alarm configuration, and depending
256 on the configuration, it will hand a message to the Alarm Notifier, which in
257 turn will send the alarm message northbound to the Consumer. :numref:`figure12`
258 also shows an optimized work flow for Ceilometer with the goal to
259 reduce the delay for fault notifications to the Consumer. The approach is to
260 implement a new notification agent (called "publisher" in Ceilometer
261 terminology) which is directly sending the alarm through the "Notification Bus"
262 to a new "Notification-driven Alarm Evaluator (NAE)" (see Sections 5.6.2 and
263 5.6.3), thereby bypassing the Collector and avoiding the additional delay of the
264 existing polling-based alarm evaluator. The NAE is similar to the OpenStack
265 "Alarm Evaluator", but is triggered by incoming notifications instead of
266 periodically polling the OpenStack "Alarms" database for new alarms. The
267 Ceilometer "Alarms" database can hold three states: "normal", "insufficient
268 data", and "fired". It is representing a persistent alarm database. In order to
269 realize the Doctor requirements, we need to define new "meters" in the database
270 (see Section 5.6.1).
271
272 .. figure:: images/figure11.png
273    :name: figure11
274    :width: 100%
275
276    Implementation plan in OpenStack (OPNFV Release 1 ”Arno”)
277
278
279 .. figure:: images/figure12.png
280    :name: figure12
281    :width: 100%
282
283    Implementation plan in Ceilometer architecture
284
285
286 NFVI Maintenance
287 ^^^^^^^^^^^^^^^^
288
289 For NFVI Maintenance, a quite similar implementation plan exists. Instead of a
290 raw fault being observed by the Monitor, the Administrator is sending a
291 Maintenance Request through the northbound interface towards the Controller
292 residing in the VIM. Similar to the Fault Management use case, the Controller
293 (in our case OpenStack Nova) will send a maintenance event to the Notifier (i.e.
294 Ceilometer in our implementation). Within Ceilometer, the same workflow as
295 described in the previous section applies. In addition, the Controller(s) will
296 take appropriate actions to evacuate the physical machines in order to prepare
297 them for the planned maintenance operation. After the physical machines are
298 emptied, the Controller will inform the Administrator that it can initiate the
299 maintenance. Alternatively the VMs can just be shut down and boot up on the
300 same host after maintenance is over. There needs to be policy for administrator
301 to know the plan for VMs in maintenance.
302
303 Information elements
304 --------------------
305
306 This section introduces all attributes and information elements used in the
307 messages exchange on the northbound interfaces between the VIM and the VNFO and
308 VNFM.
309
310 Note: The information elements will be aligned with current work in ETSI NFV IFA
311 working group.
312
313
314 Simple information elements:
315
316 * SubscriptionID (Identifier): identifies a subscription to receive fault or maintenance
317   notifications.
318 * NotificationID (Identifier): identifies a fault or maintenance notification.
319 * VirtualResourceID (Identifier): identifies a virtual resource affected by a
320   fault or a maintenance action of the underlying physical resource.
321 * PhysicalResourceID (Identifier): identifies a physical resource affected by a
322   fault or maintenance action.
323 * VirtualResourceState (String): state of a virtual resource, e.g. "normal",
324   "maintenance", "down", "error".
325 * PhysicalResourceState (String): state of a physical resource, e.g. "normal",
326   "maintenance", "down", "error".
327 * VirtualResourceType (String): type of the virtual resource, e.g. "virtual
328   machine", "virtual memory", "virtual storage", "virtual CPU", or "virtual
329   NIC".
330 * FaultID (Identifier): identifies the related fault in the underlying physical
331   resource. This can be used to correlate different fault notifications caused
332   by the same fault in the physical resource.
333 * FaultType (String): Type of the fault. The allowed values for this parameter
334   depend on the type of the related physical resource. For example, a resource
335   of type "compute hardware" may have faults of type "CPU failure", "memory
336   failure", "network card failure", etc.
337 * Severity (Integer): value expressing the severity of the fault. The higher the
338   value, the more severe the fault.
339 * MinSeverity (Integer): value used in filter information elements. Only faults
340   with a severity higher than the MinSeverity value will be notified to the
341   Consumer.
342 * EventTime (Datetime): Time when the fault was observed.
343 * EventStartTime and EventEndTime (Datetime): Datetime range that can be used in
344   a FaultQueryFilter to narrow down the faults to be queried.
345 * ProbableCause (String): information about the probable cause of the fault.
346 * CorrelatedFaultID (Integer): list of other faults correlated to this fault.
347 * isRootCause (Boolean): Parameter indicating if this fault is the root for
348   other correlated faults. If TRUE, then the faults listed in the parameter
349   CorrelatedFaultID are caused by this fault.
350 * FaultDetails (Key-value pair): provides additional information about the
351   fault, e.g. information about the threshold, monitored attributes, indication
352   of the trend of the monitored parameter.
353 * FirmwareVersion (String): current version of the firmware of a physical
354   resource.
355 * HypervisorVersion (String): current version of a hypervisor.
356 * ZoneID (Identifier): Identifier of the resource zone. A resource zone is the
357   logical separation of physical and software resources in an NFVI deployment
358   for physical isolation, redundancy, or administrative designation.
359 * Metadata (Key-value pair): provides additional information of a physical
360   resource in maintenance/error state.
361
362 Complex information elements (see also UML diagrams in :numref:`figure13`
363 and :numref:`figure14`):
364
365 * VirtualResourceInfoClass:
366
367   + VirtualResourceID [1] (Identifier)
368   + VirtualResourceState [1] (String)
369   + Faults [0..*] (FaultClass): For each resource, all faults
370     including detailed information about the faults are provided.
371
372 * FaultClass: The parameters of the FaultClass are partially based on ETSI TS
373   132 111-2 (V12.1.0) [*]_, which is specifying fault management in 3GPP, in
374   particular describing the information elements used for alarm notifications.
375
376   - FaultID [1] (Identifier)
377   - FaultType [1] (String)
378   - Severity [1] (Integer)
379   - EventTime [1] (Datetime)
380   - ProbableCause [1] (String)
381   - CorrelatedFaultID [0..*] (Identifier)
382   - FaultDetails [0..*] (Key-value pair)
383
384 .. [*] http://www.etsi.org/deliver/etsi_ts/132100_132199/13211102/12.01.00_60/ts_13211102v120100p.pdf
385
386 * SubscribeFilterClass
387
388   - VirtualResourceType [0..*] (String)
389   - VirtualResourceID [0..*] (Identifier)
390   - FaultType [0..*] (String)
391   - MinSeverity [0..1] (Integer)
392
393 * FaultQueryFilterClass: narrows down the FaultQueryRequest, for example it
394   limits the query to certain physical resources, a certain zone, a given fault
395   type/severity/cause, or a specific FaultID.
396
397   - VirtualResourceType [0..*] (String)
398   - VirtualResourceID [0..*] (Identifier)
399   - FaultType [0..*] (String)
400   - MinSeverity [0..1] (Integer)
401   - EventStartTime [0..1] (Datetime)
402   - EventEndTime [0..1] (Datetime)
403
404 * PhysicalResourceStateClass:
405
406   - PhysicalResourceID [1] (Identifier)
407   - PhysicalResourceState [1] (String): mandates the new state of the physical
408     resource.
409   - Metadata [0..*] (Key-value pair)
410
411 * PhysicalResourceInfoClass:
412
413   - PhysicalResourceID [1] (Identifier)
414   - PhysicalResourceState [1] (String)
415   - FirmwareVersion [0..1] (String)
416   - HypervisorVersion [0..1] (String)
417   - ZoneID [0..1] (Identifier)
418   - Metadata [0..*] (Key-value pair)
419
420 * StateQueryFilterClass: narrows down a StateQueryRequest, for example it limits
421   the query to certain physical resources, a certain zone, or a given resource
422   state (e.g., only resources in "maintenance" state).
423
424   - PhysicalResourceID [1] (Identifier)
425   - PhysicalResourceState [1] (String)
426   - ZoneID [0..1] (Identifier)
427
428 .. _impl_nbi:
429
430 Detailed northbound interface specification
431 -------------------------------------------
432
433 This section is specifying the northbound interfaces for fault management and
434 NFVI maintenance between the VIM on the one end and the Consumer and the
435 Administrator on the other ends. For each interface all messages and related
436 information elements are provided.
437
438 Note: The interface definition will be aligned with current work in ETSI NFV IFA
439 working group .
440
441 All of the interfaces described below are produced by the VIM and consumed by
442 the Consumer or Administrator.
443
444 Fault management interface
445 ^^^^^^^^^^^^^^^^^^^^^^^^^^
446
447 This interface allows the VIM to notify the Consumer about a virtual resource
448 that is affected by a fault, either within the virtual resource itself or by the
449 underlying virtualization infrastructure. The messages on this interface are
450 shown in :numref:`figure13` and explained in detail in the following
451 subsections.
452
453 Note: The information elements used in this section are described in detail in
454 Section 5.4.
455
456 .. figure:: images/figure13.png
457    :name: figure13
458    :width: 100%
459
460    Fault management NB I/F messages
461
462
463 SubscribeRequest (Consumer -> VIM)
464 __________________________________
465
466 Subscription from Consumer to VIM to be notified about faults of specific
467 resources. The faults to be notified about can be narrowed down using a
468 subscribe filter.
469
470 Parameters:
471
472 - SubscribeFilter [1] (SubscribeFilterClass): Optional information to narrow
473   down the faults that shall be notified to the Consumer, for example limit to
474   specific VirtualResourceID(s), severity, or cause of the alarm.
475
476 SubscribeResponse (VIM -> Consumer)
477 ___________________________________
478
479 Response to a subscribe request message including information about the
480 subscribed resources, in particular if they are in "fault/error" state.
481
482 Parameters:
483
484 * SubscriptionID [1] (Identifier): Unique identifier for the subscription. It
485   can be used to delete or update the subscription.
486 * VirtualResourceInfo [0..*] (VirtualResourceInfoClass): Provides additional
487   information about the subscribed resources, i.e., a list of the related
488   resources, the current state of the resources, etc.
489
490 FaultNotification (VIM -> Consumer)
491 ___________________________________
492
493 Notification about a virtual resource that is affected by a fault, either within
494 the virtual resource itself or by the underlying virtualization infrastructure.
495 After reception of this request, the Consumer will decide on the optimal
496 action to resolve the fault. This includes actions like switching to a hot
497 standby virtual resource, migration of the fault virtual resource to another
498 physical machine, termination of the faulty virtual resource and instantiation
499 of a new virtual resource in order to provide a new hot standby resource. In
500 some use cases the Consumer can leave virtual resources on failed host to be
501 booted up again after fault is recovered. Existing resource management
502 interfaces and messages between the Consumer and the VIM can be used for those
503 actions, and there is no need to define additional actions on the Fault
504 Management Interface.
505
506 Parameters:
507
508 * NotificationID [1] (Identifier): Unique identifier for the notification.
509 * VirtualResourceInfo [1..*] (VirtualResourceInfoClass): List of faulty
510   resources with detailed information about the faults.
511
512 FaultQueryRequest (Consumer -> VIM)
513 ___________________________________
514
515 Request to find out about active alarms at the VIM. A FaultQueryFilter can be
516 used to narrow down the alarms returned in the response message.
517
518 Parameters:
519
520 * FaultQueryFilter [1] (FaultQueryFilterClass): narrows down the
521   FaultQueryRequest, for example it limits the query to certain physical
522   resources, a certain zone, a given fault type/severity/cause, or a specific
523   FaultID.
524
525 FaultQueryResponse (VIM -> Consumer)
526 ____________________________________
527
528 List of active alarms at the VIM matching the FaultQueryFilter specified in the
529 FaultQueryRequest.
530
531 Parameters:
532
533 * VirtualResourceInfo [0..*] (VirtualResourceInfoClass): List of faulty
534   resources. For each resource all faults including detailed information about
535   the faults are provided.
536
537 NFVI maintenance
538 ^^^^^^^^^^^^^^^^
539
540 The NFVI maintenance interfaces Consumer-VIM allows the Consumer to subscribe to
541 maintenance notifications provided by the VIM. The related maintenance interface
542 Administrator-VIM allows the Administrator to issue maintenance requests to the
543 VIM, i.e. requesting the VIM to take appropriate actions to empty physical
544 machine(s) in order to execute maintenance operations on them. The interface
545 also allows the Administrator to query the state of physical machines, e.g., in
546 order to get details in the current status of the maintenance operation like a
547 firmware update.
548
549 The messages defined in these northbound interfaces are shown in :numref:`figure14`
550 and described in detail in the following subsections.
551
552 .. figure:: images/figure14.png
553    :name: figure14
554    :width: 100%
555
556    NFVI maintenance NB I/F messages
557
558 SubscribeRequest (Consumer -> VIM)
559 __________________________________
560
561 Subscription from Consumer to VIM to be notified about maintenance operations
562 for specific virtual resources. The resources to be informed about can be
563 narrowed down using a subscribe filter.
564
565 Parameters:
566
567 * SubscribeFilter [1] (SubscribeFilterClass): Information to narrow down the
568   faults that shall be notified to the Consumer, for example limit to specific
569   virtual resource type(s).
570
571 SubscribeResponse (VIM -> Consumer)
572 ___________________________________
573
574 Response to a subscribe request message, including information about the
575 subscribed virtual resources, in particular if they are in "maintenance" state.
576
577 Parameters:
578
579 * SubscriptionID [1] (Identifier): Unique identifier for the subscription. It
580   can be used to delete or update the subscription.
581 * VirtualResourceInfo [0..*] (VirtalResourceInfoClass): Provides additional
582   information about the subscribed virtual resource(s), e.g., the ID, type and
583   current state of the resource(s).
584
585 MaintenanceNotification (VIM -> Consumer)
586 _________________________________________
587
588 Notification about a physical resource switched to "maintenance" state. After
589 reception of this request, the Consumer will decide on the optimal action to
590 address this request, e.g., to switch to the standby (STBY) configuration.
591
592 Parameters:
593
594 * VirtualResourceInfo [1..*] (VirtualResourceInfoClass): List of virtual
595   resources where the state has been changed to maintenance.
596
597 StateChangeRequest (Administrator -> VIM)
598 _________________________________________
599
600 Request to change the state of a list of physical resources, e.g. to
601 "maintenance" state, in order to prepare them for a planned maintenance
602 operation.
603
604 Parameters:
605
606 * PhysicalResourceState [1..*] (PhysicalResourceStateClass)
607
608 StateChangeResponse (VIM -> Administrator)
609 __________________________________________
610
611 Response message to inform the Administrator that the requested resources are
612 now in maintenance state (or the operation resulted in an error) and the
613 maintenance operation(s) can be executed.
614
615 Parameters:
616
617 * PhysicalResourceInfo [1..*] (PhysicalResourceInfoClass)
618
619 StateQueryRequest (Administrator -> VIM)
620 ________________________________________
621
622 In this procedure, the Administrator would like to get the information about
623 physical machine(s), e.g. their state ("normal", "maintenance"), firmware
624 version, hypervisor version, update status of firmware and hypervisor, etc. It
625 can be used to check the progress during firmware update and the confirmation
626 after update. A filter can be used to narrow down the resources returned in the
627 response message.
628
629 Parameters:
630
631 * StateQueryFilter [1] (StateQueryFilterClass): narrows down the
632   StateQueryRequest, for example it limits the query to certain physical
633   resources, a certain zone, or a given resource state.
634
635 StateQueryResponse (VIM -> Administrator)
636 _________________________________________
637
638 List of physical resources matching the filter specified in the
639 StateQueryRequest.
640
641 Parameters:
642
643 * PhysicalResourceInfo [0..*] (PhysicalResourceInfoClass): List of physical
644   resources. For each resource, information about the current state, the
645   firmware version, etc. is provided.
646
647 Blueprints
648 ----------
649
650 This section is listing a first set of blueprints that have been proposed by the
651 Doctor project to the open source community. Further blueprints addressing other
652 gaps identified in Section 4 will be submitted at a later stage of the OPNFV. In
653 this section the following definitions are used:
654
655 * "Event" is a message emitted by other OpenStack services such as Nova and
656   Neutron and is consumed by the "Notification Agents" in Ceilometer.
657 * "Notification" is a message generated by a "Notification Agent" in Ceilometer
658   based on an "event" and is delivered to the "Collectors" in Ceilometer that
659   store those notifications (as "sample") to the Ceilometer "Databases".
660
661 Instance State Notification  (Ceilometer) [*]_
662 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
663
664 The Doctor project is planning to handle "events" and "notifications" regarding
665 Resource Status; Instance State, Port State, Host State, etc. Currently,
666 Ceilometer already receives "events" to identify the state of those resources,
667 but it does not handle and store them yet. This is why we also need a new event
668 definition to capture those resource states from "events" created by other
669 services.
670
671 This BP proposes to add a new compute notification state to handle events from
672 an instance (server) from nova. It also creates a new meter "instance.state" in
673 OpenStack.
674
675 .. [*] https://etherpad.opnfv.org/p/doctor_bps
676
677 Event Publisher for Alarm  (Ceilometer) [*]_
678 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
679
680 **Problem statement:**
681
682   The existing "Alarm Evaluator" in OpenStack Ceilometer is periodically
683   querying/polling the databases in order to check all alarms independently from
684   other processes. This is adding additional delay to the fault notification
685   send to the Consumer, whereas one requirement of Doctor is to react on faults
686   as fast as possible.
687
688   The existing message flow is shown in :numref:`figure12`: after receiving
689   an "event", a "notification agent" (i.e. "event publisher") will send a
690   "notification" to a "Collector". The "collector" is collecting the
691   notifications and is updating the Ceilometer "Meter" database that is storing
692   information about the "sample" which is capured from original "event". The
693   "Alarm Evaluator" is periodically polling this databases then querying "Meter"
694   database based on each alarm configuration.
695
696   In the current Ceilometer implementation, there is no possibility to directly
697   trigger the "Alarm Evaluator" when a new "event" was received, but the "Alarm
698   Evaluator" will only find out that requires firing new notification to the
699   Consumer when polling the database.
700
701 **Change/feature request:**
702
703   This BP proposes to add a new "event publisher for alarm", which is bypassing
704   several steps in Ceilometer in order to avoid the polling-based approach of
705   the existing Alarm Evaluator that makes notification slow to users.
706
707   After receiving an "(alarm) event" by listening on the Ceilometer message
708   queue ("notification bus"), the new "event publisher for alarm" immediately
709   hands a "notification" about this event to a new Ceilometer component
710   "Notification-driven alarm evaluator" proposed in the other BP (see Section
711   5.6.3).
712
713   Note, the term "publisher" refers to an entity in the Ceilometer architecture
714   (it is a "notification agent"). It offers the capability to provide
715   notifications to other services outside of Ceilometer, but it is also used to
716   deliver notifications to other Ceilometer components (e.g. the "Collectors")
717   via the Ceilometer "notification bus".
718
719 **Implementation detail**
720
721   * "Event publisher for alarm" is part of Ceilometer
722   * The standard AMQP message queue is used with a new topic string.
723   * No new interfaces have to be added to Ceilometer.
724   * "Event publisher for Alarm" can be configured by the Administrator of
725     Ceilometer to be used as "Notification Agent" in addition to the existing
726     "Notifier"
727   * Existing alarm mechanisms of Ceilometer can be used allowing users to
728     configure how to distribute the "notifications" transformed from "events",
729     e.g. there is an option whether an ongoing alarm is re-issued or not
730     ("repeat_actions").
731
732 .. [*] https://etherpad.opnfv.org/p/doctor_bps
733
734 Notification-driven alarm evaluator (Ceilometer) [*]_
735 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
736
737 **Problem statement:**
738
739 The existing "Alarm Evaluator" in OpenStack Ceilometer is periodically
740 querying/polling the databases in order to check all alarms independently from
741 other processes. This is adding additional delay to the fault notification send
742 to the Consumer, whereas one requirement of Doctor is to react on faults as fast
743 as possible.
744
745 **Change/feature request:**
746
747 This BP is proposing to add an alternative "Notification-driven Alarm Evaluator"
748 for Ceilometer that is receiving "notifications" sent by the "Event Publisher
749 for Alarm" described in the other BP. Once this new "Notification-driven Alarm
750 Evaluator" received "notification", it finds the "alarm" configurations which
751 may relate to the "notification" by querying the "alarm" database with some keys
752 i.e. resource ID, then it will evaluate each alarm with the information in that
753 "notification".
754
755 After the alarm evaluation, it will perform the same way as the existing "alarm
756 evaluator" does for firing alarm notification to the Consumer. Similar to the
757 existing Alarm Evaluator, this new "Notification-driven Alarm Evaluator" is
758 aggregating and correlating different alarms which are then provided northbound
759 to the Consumer via the OpenStack "Alarm Notifier". The user/administrator can
760 register the alarm configuration via existing Ceilometer API [*]_. Thereby, he
761 can configure whether to set an alarm or not and where to send the alarms to.
762
763 **Implementation detail**
764
765 * The new "Notification-driven Alarm Evaluator" is part of Ceilometer.
766 * Most of the existing source code of the "Alarm Evaluator" can be re-used to
767   implement this BP
768 * No additional application logic is needed
769 * It will access the Ceilometer Databases just like the existing "Alarm
770   evaluator"
771 * Only the polling-based approach will be replaced by a listener for
772   "notifications" provided by the "Event Publisher for Alarm" on the Ceilometer
773   "notification bus".
774 * No new interfaces have to be added to Ceilometer.
775
776
777 .. [*] https://etherpad.opnfv.org/p/doctor_bps
778 .. [*] https://wiki.openstack.org/wiki/Ceilometer/Alerting
779
780 Report host fault to update server state immediately (Nova) [*]_
781 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
782
783 **Problem statement:**
784
785 * Nova state change for failed or unreachable host is slow and does not reliably
786   state host is down or not. This might cause same server instance to run twice
787   if action taken to evacuate instance to another host.
788 * Nova state for server(s) on failed host will not change, but remains active
789   and running. This gives the user false information about server state.
790 * VIM northbound interface notification of host faults towards VNFM and NFVO
791   should be in line with OpenStack state. This fault notification is a Telco
792   requirement defined in ETSI and will be implemented by OPNFV Doctor project.
793 * Openstack user cannot make HA actions fast and reliably by trusting server
794   state and host state.
795
796 **Proposed change:**
797
798 There needs to be a new API for Admin to state host is down. This API is used to
799 mark services running in host down to reflect the real situation.
800
801 Example on compute node is:
802
803 * When compute node is up and running:::
804
805     vm_state: activeand power_state: running
806     nova-compute state: up status: enabled
807
808 * When compute node goes down and new API is called to state host is down:::
809
810     vm_state: stopped power_state: shutdown
811     nova-compute state: down status: enabled
812
813 **Alternatives:**
814
815 There is no attractive alternative to detect all different host faults than to
816 have an external tool to detect different host faults. For this kind of tool to
817 exist there needs to be new API in Nova to report fault. Currently there must be
818 some kind of workarounds implemented as cannot trust or get the states from
819 OpenStack fast enough.
820
821 .. [*] https://blueprints.launchpad.net/nova/+spec/update-server-state-immediately
822
823 Other related BPs
824 ^^^^^^^^^^^^^^^^^
825
826 This section lists some BPs related to Doctor, but proposed by drafters outside
827 the OPNFV community.
828
829 pacemaker-servicegroup-driver [*]_
830 __________________________________
831
832 This BP will detect and report host down quite fast to OpenStack. This however
833 might not work properly for example when management network has some problem and
834 host reported faulty while VM still running there. This might lead to launching
835 same VM instance twice causing problems. Also NB IF message needs fault reason
836 and for that the source needs to be a tool that detects different kind of faults
837 as Doctor will be doing. Also this BP might need enhancement to change server
838 and service states correctly.
839
840 .. [*] https://blueprints.launchpad.net/nova/+spec/pacemaker-servicegroup-driver
841
842 ..
843  vim: set tabstop=4 expandtab textwidth=80: