qnote:mellanox

Быстрые заметки по сетевому оборудованию Mellanox

Состояния конфигурации при апгрейде и даунгрейде MLNX-OS\Onyx

Общие положения о состояниях конфигурации:

  1. При апгрейде сохраняется текущая конфигурация коммутатора.
    Конфигурация сохраняется в момент выполнения команды “image boot next”.
  2. При даунгрейде, коммутатор возвращается к конфигурации, которая была на момент апгрейда (!!).
    При этом не важно сколько изменений уже было сделано на более новой версии софта, всегда будет возврат к “старой” конфигурации.
    Такое поведение опасно, можно слишком далеко вернуться и, например, привести в нерабочее состояние MLAG-пару. При этом нельзя заранее посмотреть на какую конфигурацию будет сделан даунгрейд.
    При апгрейдах крайне желательно записывать когда и с какой конфигурации обновлялись.
  3. Если после даунгрейда состояние конфига не устроит, слишком много изменений уже было сделано, и захочется вернуться на версию с которой даунгрейдились, то это не получится, см. пункт 1.
    При выполнении команды “image boot next” сохранится текущая конфигурация.
    Восстановить конфигурацию можно только вбив её заново или перезалив.

Рассмотрим на примере.
Есть коммутатор SN2100 который тестово обновили до 3.6.8100 через одну промежуточную версию.
3.6.5011 –> 3.6.6000 –> 3.6.8100
А потом сделали даунгрейд с 3.6.8100 обратно до 3.6.5011.
После каждого обновления делались небольшие изменения в конфигурации по которым можно было отследить на какую версию шел откат при даунгрейде.

В итоге получилась такая схема переходов состояний конфигураций при обновлении и смене загрузочных разделов.

Видно, что при даунгрейде всегда идет откат на версию софта, которая была на момент апгрейда.


Перезагрузка коммутатора работающего на ONYX

Коммутатор не спрашивает подтверждения перезагрузки, а сразу делает её.
Версия:

mlnx21 [standalone: master] (config) # sh version 
Product name:      Onyx
Product release:   3.6.8008
...
mlnx21 [standalone: master] # reload 


Rebooting...


System shutdown initiated -- logging off.


Mellanox Onyx Switch Management
mlnx21 login: [ 3570.134455] mst[10648]: Stopping MST (Mellanox Software Tools) driver set
[ 3570.252954] mst[10648]: Unloading MST PCI configuration module - Success
[ 3570.262534] mst[10648]: Unloading MST PCI module - Success

“[ 3570.262534]” - это аптайм коммутатора в секундах.

Варианты reload:

mlnx21 [standalone: master] # reload ?
<cr>                           Reboot the system
force                          Force an expedited reboot of the system even if
                               it's busy
halt                           Shut down the system
noconfirm                      Reboot the system without asking about unsaved
                               changes

Выключить коммутатор работающий на ONYX

После выключения включить можно только дернув питание, на консоль не реагирует.

TEST1-MLNX22-TEST1 [standalone: master] # reload halt 
Configuration has been modified; save first? [yes] y
Configuration changes saved.
Halting system...
TEST1-MLNX22-TEST1 [standalone: master] # 

System shutdown initiated -- logging off.

Mellanox MLNX-OS Switch Management

TEST1-MLNX22-TEST1 login: 
Stopping pm: [  OK  ]
Stopping haveged: [  OK  ]
Stopping system message bus: [  OK  ]
Shutting down kernel logger: [  OK  ]
Shutting down system logger: [  OK  ]
Sending all processes the TERM signal... [  OK  ]
Sending all processes the KILL signal... [  OK  ]
Remounting root filesystem in read-write mode: 
Saving random seed:  [  OK  ]
Syncing hardware clock to system time [  OK  ]
Running vpart script:  [  OK  ]
Unmounting file systems:  [  OK  ]
Remounting root filesystem in read-only mode: 
Running vpart script: 
init: Re-executing /sbin/init
Halting system...

Состояние SFP на выключенном порту

Даже если порт в shutdown, все равно можно посмотреть уровни оптических сигналов.

# sh interfaces status 
-----------------------------------------------------------------------------------------------------------

Port                Oper State          Admin     Speed          Description                             
-----------------------------------------------------------------------------------------------------------
mgmt0               Up                  Enabled   1000Mb/s (auto)-
...
Eth1/10             Down                Disabled  10 Gbps        xxx
...

# sh interfaces ethernet 1/10 transceiver diagnostics 
Port 1/10 transceiver diagnostic data:
   Temperature (-127C to +127C) 
        Temperature                   : 34 C
        Hi Temp Alarm Thresh          : 80 C
        Low Temp Alarm Thresh         : -10 C
        Temperature Alarm             : None 

   Voltage ( 0 to 6.5535 V) 
        Voltage                       : 3.21990 V
        Hi Volt Alarm Thresh          : 3.79990 V
        Low Volt Alarm Thresh         : 2.79990 V
        Voltage Alarm                 : None 

   Tx Bias Current ( 0 to 131 mA) 
        Ch1 Tx Current                : 37.73400 mA
        Hi Tx Crnt Alarm Thresh       : 80.00000 mA
        Low Tx Crnt Alarm Thresh      : 5.00000 mA
        Ch1 Tx Current Alarm          : None 

   Tx Power ( 0 mW to 6.5535 mW / 8.1647 dBm) 
        Ch1 Tx Power                  : 2.15520 mW / 3.33488 dBm
        Hi Tx Power Alarm Thresh      : 5.01180 mW / 6.99994 dBm
        Low Tx Power Alarm Thresh     : 0.79430 mW / -1.00015 dBm
        Ch1 Tx Power Alarm            : None 

   Rx Power ( 0 mW to 6.5535 mW / 8.1647 dBm) 
        Ch1 Rx Power                  : 0.00260 mW / -25.85027 dBm
        Hi Rx Power Alarm Thresh      : 0.25110 mW / -6.00153 dBm
        Low Rx Power Alarm Thresh     : 0.00250 mW / -26.02060 dBm
        Ch1 Rx Power Alarm            : None 

        Vendor Date Code (dd-mm-yyyy) : 05-03-2019

Посмотреть серийный номер железки

m9-mlnx92 [MLAG-DOM11: master] # sh inventory 
-----------------------------------------------------------------------------
Module           Part Number        Serial Number        Asic Rev.    HW Rev.
-----------------------------------------------------------------------------
CHASSIS          MSN2100-CB2F       MT1745K00000         N/A          AD
MGMT             MSN2100-CB2F       MT1745K00000         0            AD

Время загрузки MLNX-0S

MLNX-OS версии 3.6.4112 в режиме MLAG загружается за 3 минуты 30 секунд (+-5 секунд).
Не в MLAG режиме загружается примерно за 1 минуту.

qnote/mellanox.txt · Last modified: 2021/08/12 08:35 (external edit)

Page Tools