State-Space Kontrolörü Çözüm Yolu

Not

Bu öğreticiyi izlemeden önce, okuyucuların bir durum-uzay kontrolüne girişi okumaları önerilir Durum Uzayı - State-space Kontrolüne Giriş

Bu öğreticinin amacı, bir volan için bir durum-uzay kontrolörünün uygulanmasına ilişkin “uçtan uca” talimatlar sağlamaktır. Bu öğreticiyi takip ederek okuyucular şunları öğreneceklerdir:

  1. system identification kullanarak veya CAD yazılımı kullanarak bir çakın doğru durum-uzay modelini oluşturun.

  2. Enkoder hızı ölçümlerini gecikmeden filtrelemek için bir Kalman Filtresi uygulayın.

  3. Bir LQR geri besleme denetleyicisi uygulayın; bu, model tabanlı ileri besleme ile birleştirildiğinde, çarkı a reference “referans” a sürmek için voltaj inputs oluşturur.

Bu öğretici, çok fazla programlama uzmanlığı olmayan ekipler için ulaşılabilir olması amaçlanmıştır. WPILib kitaplığı, durum-uzay kontrol özelliklerinin uygulanma biçiminde önemli bir esneklik sunarken, bu eğitimde ana hatları verilen uygulamayı yakından takip etmek, ekiplere çeşitli durum-uzay sistemleri için yeniden kullanılabilecek temel bir yapı sağlamalıdır.

Tam örnek, durum uzayı volanında (Java <https://github.com/wpilibsuite/allwpilib/blob/main/wpilibjExamples/src/main/java/edu/wpi/first/wpilibj/examples/statespaceflywheel/Robot.java> __ / C ++ <https://github.com/wpilibsuite/allwpilib/blob/main/wpilibcExamples/src/main/cpp/examples/StateSpaceFlywheel/cpp/Robot.cpp> __) ve durum uzayı volan sistemi tanımlamasında (Java <https://github.com/wpilibsuite/allwpilib/blob/main/wpilibjExamples/src/main/java/edu/wpi/first/wpilibj/examples/statespaceflywheelsysid/Robot.java> __ / C ++ <https://github.com/wpilibsuite/allwpilib/blob/main/wpilibcExamples/src/main/cpp/examples/StateSpaceFlywheelSysId/cpp/Robot.cpp> __) mevcuttur.

State-Space Control-Durum Uzayı Kontrolü Neden Kullanılır?

State-Space Control-Durum-uzay kontrolü, sistemimizin doğru bir modelini oluşturmaya odaklandığından, model will respond to control inputs 1 e nasıl tepki vereceğini doğru bir şekilde tahmin edebiliriz. Bu, mekanizmalarımızı fiziksel bir robota erişim olmadan simüle etmemize ve aynı zamanda kolayca seçim yapmamıza olanak tanır gains iyi çalışacağını bildiğimiz kazançlardır. Bir modele sahip olmak, sensör okumalarını en iyi şekilde filtrelemek için Kalman Filtreleri gibi gecikmesiz filtreler oluşturmamıza da olanak tanır.

Flywheel-Volanımızın Modellenmesi

Recall that continuous state-space systems are modeled using the following system of equations:

\[\begin{split}\dot{\mathbf{x}} &= \mathbf{A}\mathbf{x} + \mathbf{B}\mathbf{u} \\ \mathbf{y} &= \mathbf{C}\mathbf{x} + \mathbf{D}\mathbf{u}\end{split}\]

Nerede x-dot , system’ nin değişim oranıdır state, \(\mathbf{x}\) sistemin mevcut durumu, \(\mathbf{u}\) , sisteme input ve \(\mathbf{y}\), sistemin output. dır.

Volanımızı iki farklı şekilde modellemek için bu denklem sistemini kullanalım. Önce frc-karakterizasyon araç takımını kullanarak system identification kullanarak modelleyeceğiz ve ardından bunu motor ve volanın moment of inertia, temelinde modelleyeceğiz.

Durum uzayı sistemimizi oluşturmanın ilk adımı, sistemimizin durumlarını seçmektir. Devlet olarak istediğimiz her şeyi seçebiliriz - istersek tamamen ilgisiz durumları seçebiliriz - ama önemli olan durumları seçmeye yardımcı olur. Bizim durumumuzdaki hidden states ifadesini dahil edebiliriz (sadece konumunu ölçebilseydik asansör hızı gibi) ve Kalman Filtremizin değerlerini tahmin etmesine izin verebiliriz. Seçtiğimiz durumların, geribildirim denetleyicisi tarafından ilgili references e doğru yönlendirileceğini unutmayın (tipik olarak : ref:` Doğrusal Karesel Düzenleyici <docs/software/advanced-controls/state-space/state-space-intro:The Linear-Quadratic Regulator>`, çünkü optimaldir).

Volanımız için yalnızca tek bir durumu önemsiyoruz : hızı. İvmesini de modellemeyi seçebilirken, bu durumun dahil edilmesi sistemimiz için gerekli değildir.

Daha sonra, : terimini tanımlıyoruz: `sistemimize <input> girişleri. Girdiler, durumunu değiştirmek için sistemimize “into-içine” koyabileceğimiz şeyler olarak düşünülebilir. Volan (ve FRC ® ‘deki diğer birçok tek eklemli mekanizma) durumunda, sadece bir girişimiz var: motora uygulanan voltaj. Girişimiz olarak voltajı seçerek (motor görev döngüsü gibi bir şey üzerinde), akü yükü arttıkça akü voltajındaki düşüşü telafi edebiliriz.

Sürekli zaman durum-uzay sistemi şunu yazar x-dot veya sistemin system' durumunun anlık değişim oranı, şu anki state ile orantılı olarak ve inputs<input>’. Durumumuz açısal hız olduğundan, :math:mathbf{dot{x}}` volanın açısal ivmesi olacaktır.

Daha sonra, çarkımızı sürekli zaman durum-uzay sistemi olarak modelleyeceğiz. WPILib’in LinearSystem’ sistemi bunu dahili olarak ayrık zamana dönüştürecektir. Gözden geçirme : ref: “durum uzayı gösterimi <docs/software/advanced-controls/state-space/state-space-intro:What is State-Space Notation?>``, sürekli zamanlı ve ayrık zamanlı sistemler hakkında daha fazla bilgi için.

Sistem Tanımlama ile Modelleme

Bunu durum uzayı gösteriminde system identification kullanarak yeniden yazmak için , state-space notation example volan örneğini tekrar hatırlıyoruz, burada aşağıdaki denklemi şu terimlerle yeniden yazdık \(\mathbf{a}\)

\[\begin{split}V = kV \cdot \mathbf{v} + kA \cdot \mathbf{a}\\ \mathbf{a} = \mathbf{\dot{v}} = \begin{bmatrix}\frac{-kV}{kA}\end{bmatrix} v + \begin{bmatrix}\frac{1}{kA}\end{bmatrix} V\end{split}\]

Burada:math:mathbf{v} , volan hızıdır,:math:mathbf{a} ve:math:mathbf{dot{v}}, volan ivmesidir ve \(V\) voltajdır. Bunu, durum vektörü için standart \(\mathbf{x}\) ve giriş vektörü için : math:mathbf {u} standart kuralıyla yeniden yazarak şunu buluruz:

\[\mathbf{\dot{x}} = \begin{bmatrix}\frac{-kV}{kA} \end{bmatrix} \mathbf{x} + \begin{bmatrix}\frac{1}{kA} \end{bmatrix} \mathbf{u}\]

Durum uzayı notasyonunun ikinci bölümü, sistemin o anki :term:state ve girdileri ile output ile ilişkilidir. Bir volan durumunda, çıktı vektörümüz \(\mathbf{y}\) (veya sensörlerimizin ölçebildiği şeyler) volanımızın hızıdır ve bu da bizim state \(\mathbf{x}\) vektörümüzün bir unsuru olur . Bu nedenle, çıktı matrisimiz \(\mathbf{C} = \begin{bmatrix}1 \end{bmatrix}\) ve sistem besleme matrisimiz \(\mathbf{D} = \begin{bmatrix}0 \end{bmatrix}\) olur. Bunu sürekli zaman durum uzayı gösteriminde yazmak aşağıdakileri verir.

\[\begin{split}\mathbf{\dot{x}} &= \begin{bmatrix}\frac{-kV}{kA} \end{bmatrix} \mathbf{x} + \begin{bmatrix}\frac{1}{kA} \end{bmatrix} \mathbf{u} \\ \mathbf{y} &= \begin{bmatrix}1\end{bmatrix} \mathbf{x} + \begin{bmatrix}0\end{bmatrix} \mathbf{u}\end{split}\]

LinearSystem sınıfı, şu şekilde tanımlanmış durum uzayı sistemlerini kolayca oluşturmak için yöntemler içerir system identification. Bu örnek, kV değeri 0,023 ve kA değeri 0,001 olan bir volan modelini göstermektedir:

36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
  // Volts per (radian per second)
  private static final double kFlywheelKv = 0.023;

  // Volts per (radian per second squared)
  private static final double kFlywheelKa = 0.001;

  // The plant holds a state-space model of our flywheel. This system has the following properties:
  //
  // States: [velocity], in radians per second.
  // Inputs (what we can "put in"): [voltage], in volts.
  // Outputs (what we can measure): [velocity], in radians per second.
  //
  // The Kv and Ka constants are found using the FRC Characterization toolsuite.
  private final LinearSystem<N1, N1, N1> m_flywheelPlant = LinearSystemId.identifyVelocitySystem(
        kFlywheelKv, kFlywheelKa);

Volan Atalet Momenti ve Dişli Kullanarak Modelleme

Bir volan ayrıca, motorlar, dişliler ve volan hakkındaki bilgiler kullanılarak fiziksel bir robota erişim olmaksızın modellenebilir moment of inertia. Bu modelin tam bir türevi, Controls Engineering in FRC. ‘de Kontrol Mühendisliği Bölüm 8.2.1’de sunulmuştur.

LinearSystem sınıfı, volanın motorlarından, dişlilerinden ve :term:atalet momenti-moment of inertia nden kolayca bir volan modeli oluşturmak için yöntemler içerir. Eylemsizlik momenti, CAD yazılımı veya fizik kullanılarak hesaplanabilir. Burada kullanılan örnekler, volan örnek projesinde (Java/C++) detaylandırılmıştır.

Not

WPILib’in durum uzayı sınıfları için dişli, giriş üzerinden çıkış olarak yazılır - yani, volan motorlardan daha yavaş dönüyorsa, bu sayı birden büyük olmalıdır.

Not

C ++ LinearSystem sınıfı, birim karışıklıklarını önlemek ve boyutluluğu ileri sürmek için the C++ Units Library kullanır.

37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
  private static final double kFlywheelMomentOfInertia = 0.00032; // kg * m^2

  // Reduction between motors and encoder, as output over input. If the flywheel spins slower than
  // the motors, this number should be greater than one.
  private static final double kFlywheelGearing = 1.0;

  // The plant holds a state-space model of our flywheel. This system has the following properties:
  //
  // States: [velocity], in radians per second.
  // Inputs (what we can "put in"): [voltage], in volts.
  // Outputs (what we can measure): [velocity], in radians per second.
  private final LinearSystem<N1, N1, N1> m_flywheelPlant = LinearSystemId.createFlywheelSystem(
        DCMotor.getNEO(2),
        kFlywheelMomentOfInertia,
        kFlywheelGearing);

Kalman Filtreleri: Volan Durumunu Gözlemleme

Kalman filtreleri, bir durum tahmini oluşturmak için durum uzayı modelimizi kullanarak hız ölçümlerimizi filtrelemek için kullanılır : math:mathbf {hat {x}}. Volan modelimiz doğrusal olduğundan, volanın hızını tahmin etmek için bir Kalman filtresi kullanabiliriz. WPILib’in Kalman filtresi, model ve sensör ölçümlerinin standart sapmalarıyla birlikte bir LinearSystem (yukarıda bulduğumuz) alır. Bu ağırlıkları ayarlayarak durum tahminimizin ne kadar “smooth-düzgün” olduğunu ayarlayabiliriz. Daha büyük durum standart sapmaları, filtrenin durumumuza “distrust-güvenmemesine” ve yeni ölçümleri daha fazla tercih etmesine neden olurken, daha büyük ölçüm standart sapmaları bunun tersini yapacaktır.

Bir volan durumunda, 3 rad / s’lik bir durum standart sapması ve 0.01 rad / s’lik bir ölçüm standardı sapması ile başlarız. Bu değerler kullanıcının seçmesine bağlıdır - bu ağırlıklar bir miktar gürültüye toleranslı olan ancak durum tahmini a volan için dış parazitlere hızlı bir şekilde tepki veren bir filtre üretti ve aşağıdakiler için iyi davranan bir filtre oluşturmak için ayarlanmalıdır. özel volanınız. Zaman içindeki durumları, ölçümleri, girdileri, referansları ve çıktıları grafiklemek, Kalman filtrelerini ayarlamak için harika bir görsel yoldur.

The effect of a Kalman, median, and IIR filters on some flywheel data.

Yukarıdaki grafik, iki farklı şekilde ayarlanmış Kalman filtresinin yanı sıra bir:single-pole IIR filter ve Median Filtresi gösterir. Bu veriler, bir atıcı ile ~ 5 saniyede toplandı ve dört top, atıcıdan geçirildi (hızdaki dört düşüşte görüldüğü gibi). İyi durum ve ölçüm standardı sapmalarını seçme konusunda katı kurallar olmamakla birlikte, bunlar genel olarak, harici rahatsızlıklara hızlı tepki verirken gürültüyü reddedecek kadar modele güvenecek şekilde ayarlanmalıdır.

Because the feedback controller computes error using the x-hat estimated by the Kalman filter, the controller will react to disturbances only as quickly the filter’s state estimate changes. In the above chart, the upper left plot (with a state standard deviation of 3.0 and measurement standard deviation of 0.2) produced a filter that reacted quickly to disturbances while rejecting noise, while the upper right plot shows a filter that was barely affected by the velocity dips.

54
55
56
57
58
59
60
  private final KalmanFilter<N1, N1, N1> m_observer = new KalmanFilter<>(
        Nat.N1(), Nat.N1(),
        m_flywheelPlant,
        VecBuilder.fill(3.0), // How accurate we think our model is
        VecBuilder.fill(0.01), // How accurate we think our encoder
        // data is
        0.020);

Kalman filtreleri : ref: docs / software / advanced-controls / state-space / state-space-observers: Predict step’de durum uzayı modelimizi kullandığından, modelimizin mümkün olduğu kadar doğru olması önemlidir. Bunu doğrulamanın bir yolu, bir volanın giriş voltajını ve zaman içindeki hızını kaydetmek ve bu verileri Kalman filtresinde yalnızca predict-tahmin olarak adlandırarak yeniden yürütmektir. Daha sonra, kV ve kA kazançları (veya eylemsizlik momenti ve diğer sabitler), model kaydedilen verilerle yakından eşleşene kadar ayarlanabilir.

Doğrusal-Kuadratik Düzenleyiciler ve Plant Inversion Feedforward-İleri Besleme

Linear-Quadratic Regulator / Doğrusal-Kuadratik Düzenleyici, volanımızı system i reference a sürmek için bir geri bildirim denetleyicisi bulur . Volanımızın sadece bir durumu olduğu için, LQR’miz tarafından seçilen kontrol yasası şu biçimde olacaktır \(\mathbf{u = K (r - x)}\) burada \(\mathbf{K}\), bir 1x1 matrisdir; başka bir deyişle, LQR tarafından seçilen kontrol kuralı basitçe orantılı bir kontrolör veya sadece bir P kazancı olan bir PID kontrolörüdür. Bu kazanç, LQR’miz tarafından, geçtiğimiz durum gezi ve kontrol çabalarına göre seçilir. LQR denetleyicilerinin ayarlanması hakkında daha fazla bilgi şu adreste bulunabilir LQR uygulama örneği.

SimpleMotorFeedforward gibi, kS, kV ve kA sabitleri verilen ileri besleme voltaj girişleri oluşturmak için kullanılabilir, Plant Inversion Feedforward sınıfı, bir durum uzay sistemi verilen feedforward voltaj girişlerini üretir. `` LinearSystemLoop`` sınıfı tarafından üretilen gerilim komutları ileri besleme ve geri besleme girişlerinin toplamıdır.

63
64
65
66
67
68
69
70
71
72
  private final LinearQuadraticRegulator<N1, N1, N1> m_controller
        = new LinearQuadraticRegulator<>(m_flywheelPlant,
        VecBuilder.fill(8.0), // qelms. Velocity error tolerance, in radians per second. Decrease
        // this to more heavily penalize state excursion, or make the controller behave more
        // aggressively.
        VecBuilder.fill(12.0), // relms. Control effort (voltage) tolerance. Decrease this to more
        // heavily penalize control effort, or make the controller less aggressive. 12 is a good
        // starting point because that is the (approximate) maximum voltage of a battery.
        0.020); // Nominal time between loops. 0.020 for TimedRobot, but can be
  // lower if using notifiers.

Hepsini Bir Araya Getirin : LinearSystemLoop

LinearSystemLoop, daha önce oluşturduğumuz sistemimizi, denetleyicimizi ve gözlemcimizi birleştirir. Gösterilen kurucu ayrıca bir PlantInversionFeedforward başlatacaktır.

73
74
75
76
77
78
  // The state-space loop combines a controller, observer, feedforward and plant for easy control.
  private final LinearSystemLoop<N1, N1, N1> m_loop = new LinearSystemLoop<>(
      m_flywheelPlant,
        m_controller,
        m_observer,
        12.0,

LinearSystemLoop umuza sahip olduğumuzda, geriye kalan tek şey onu çalıştırmaktır. Bunu yapmak için, Kalman filtremizi yeni enkoder hız ölçümlerimizle periyodik olarak güncelleyeceğiz ve ona yeni voltaj komutları uygulayacağız. Bunu yapmak için, önce reference yi, ardından mevcut volan hızıyla correct`, bir sonraki zaman adımına Kalman filtresini predict ve getU kullanılarak oluşturulan girdileri uyguluyoruz. .

101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
  @Override
  public void teleopPeriodic() {
    // Sets the target speed of our flywheel. This is similar to setting the setpoint of a
    // PID controller.
    if (m_joystick.getTriggerPressed()) {
      // We just pressed the trigger, so let's set our next reference
      m_loop.setNextR(VecBuilder.fill(kSpinupRadPerSec));
    } else if (m_joystick.getTriggerReleased()) {
      // We just released the trigger, so let's spin down
      m_loop.setNextR(VecBuilder.fill(0.0));
    }

    // Correct our Kalman filter's state vector estimate with encoder data.
    m_loop.correct(VecBuilder.fill(m_encoder.getRate()));

    // Update our LQR to generate new voltage commands and use the voltages to predict the next
    // state with out Kalman filter.
    m_loop.predict(0.020);

    // Send the new calculated voltage to the motors.
    // voltage = duty cycle * battery voltage, so
    // duty cycle = voltage / battery voltage
    double nextVoltage = m_loop.getU(0);
    m_motor.setVoltage(nextVoltage);
  }
}