1. Experimentelle Hintergrund
3D3C-PIV oder tomo graphisches PIV ist ein gängiges PIV-Messsystem, das die sofortige Messung aller drei Geschwindigkeit komponenten in einem drei dimensionalen Volumen unterstützt. Der Berechnungs prozess des drei dimensionalen Geschwindigkeit feldes kann in drei Schritte unterteilt werden: Volumen kalibrierung, Voxel raum rekonstruktion und drei dimensionale Kreuz korrelation berechnung (wie in Abbildung 1 dargestellt).

Abbildung 1 3 D3C PIV Berechnungs schritte
Wenn in der Durchfluss feld berechnung zu viele gültige Voxel oder Berechnungs fenster vorhanden sind, wie z. B. die Berechnung des Rühr strömungs feldes und des Jet-Flow-Feldes, dauert die herkömmliche CPU-Single-Thread-Berechnung lange. oder das Berechnungs ergebnis kann aufgrund unzureichenden Speicher platzes nicht berechnet werden.
GPU, dh durch CUDA-Programmierung, kann Tausende von Threads gleichzeitig ausführen, die parallele Berechnung von Bildern in großem Maßstab unterstützen und die Effizienz der PIV-Flow-Feld berechnung erheblich verbessern.
2. Zweck des Experiments
Überprüfen Sie quantitativ die GPU-Beschleunigung leistung unter gemeinsamen Fluss feldern mit unterschied lichen Partikel zahlen.
3. Experimentelle Umgebung
Betriebs system | W indow10 |
CPU-Modell | INTEL 13790F |
GPU-Modell | NAVIDIA RTX4070TiS |
Tabelle 1 Experimentelle Testumgebung
4. Experimentelles Design
4.1 Entwerfen Sie die Strömungs feld bedingungen der vier Experimente wie folgt (siehe beigefügte Abbildung für die Originalbilder):
Fließ feldtyp | Beschreibung des Fluss feldes | Durchfluss feld raum größe (mm) | Bild auflösung | Gesamtzahl der Voxel | Anzahl der gültigen Voxel | Flüssigkeits berechnung fenster | Anzahl der gültigen Fenster |
Kleine Anzahl von Partikeln, spärliche Verteilung | X (-20.0, 35.0) | 1280x1024 | 75.191.040 | 7781 | 3654 | 590 | |
Simulation des Advektion feldes | Y (-20.0, 20.0) | ||||||
Z (-7.0, 4.0) | |||||||
Die Anzahl der Partikel ist gering und die Verteilung ist spärlich | X (-50.0, 50.0) | 1280x1024 | 48.468.222 | 32201 | 1995 | 850 | |
Tatsächliche experimentelle Daten, Partikel in Wasser rühren | Y (-45.0, 45.0) | ||||||
Z (-8.0, 5.0) | |||||||
Es gibt viele Partikel, verteilt in der Mitte des Sichtfeldes | X (-105.0, 105.0) | 2560x1920 | 623.661.472 | 1,32 Millionen | 31752 | 13111 | |
Tatsächliche experimentelle Daten, Partikel in Wasser rühren | Y (-52,5, 97,5) | ||||||
Z (-15,0, 12,0) | |||||||
Die Gesamtzahl der Partikel ist groß und dicht im gesamten Sichtfeld verteilt | X (-50.0, 50.0) | 2560x1920 | 892.984.616 | 320 Millionen | 46410 | 46410 | |
Jet-Gas-Flow-Feld | Y (-40.0, 40.0) | ||||||
Z (-18.0, 0) |
Tabelle 2 Experimentelle Bedingungen Design-Tabelle
In den Abbildungen 2 bis 5 sind vier PIV-Hoch geschwindigkeit kameras von Revealer dargestellt:
Abbildung 2 Experimentelles Strömungs feld 1-Originalbild des simulierten flachen Strömungs feldes
Abbildung 3 Experimentelles Strömungs feld 2-Originalbild des gerührten Wasserstrom feldes (wenige Partikel)
Abbildung 4 Experimentelles Strömungs feld 3-Originalbild des gerührten Wasserstrom feldes (mehrere Partikel)
Abbildung 5 Experimentelles Strömungs feld 4-Originalbild des Jet-Flow-Feldes
4.2 Die 3D3C-PIV-Berechnungs schritte sind in zwei Stufen unterteilt, und die GPU-Beschleunigung leistung wird schrittweise quantitativ untersucht.
Basierend auf der Berechnungs stufe zur Rekonstruktion des Voxel raums wird die Berechnungs zeit von GPU und CPU horizontal verglichen.
In der drei dimensionalen Kreuz korrelation berechnungs stufe wird ein horizontaler quantitativer Vergleich der GPU-und CPU-Berechnungs zeit durchgeführt.
5. Experimentelle Daten
5.1 Experiment 1-Simulation des Advektion feldes
5.1.1 Horizontaler Vergleich der CPU-Voxel-Raum rekonstruktion und der GPU-Voxel-Rekonstruktion berechnungs ergebnisse. Abbildung 6 oben ist CPU, und Abbildung 6 unten ist GPU
Abbildung 6 Berechnungs ergebnisse für die CPU-Voxel-Raum rekonstruktion
Abbildung 6 Ergebnisse der Berechnung der GPU-Voxel-Raum rekonstruktion
Timing-Ergebnisse: Die CPU dauerte 15,8 Sekunden, die GPU dauerte nur 1,2 Sekunden und die Bewertung des Rück projektions fehlers betrug 1.
5.1.2 Horizontales Verhältnis von CPU-und GPU 3D-Quer korrelation berechnungs ergebnissen. Abbildung 7 oben ist CPU, und Abbildung 7 unten ist GPU
Abbildung 7 CPU 3D Quer korrelation berechnungs ergebnisse
Abbildung 7 Ergebnisse der GPU 3D-Querkorrelation-Berechnung
Timing-Ergebnisse: Die CPU dauerte 2,9 Sekunden, während die GPU nur 0,8 Sekunden dauerte.
5.2 Experiment 2-Rührtes Wasserstrom feld (wenige Partikel)
5.2.1 CPU Voxel Raum Rekonstruktion und GPU Voxel Raum Rekonstruktion Berechnung Ergebnisse horizontales Verhältnis, Abbildung 8 oben ist CPU, Abbildung 8 unten ist GPU
Video
Abbildung 8 Berechnungs ergebnisse für die CPU-Rekonstruktion
Video
Abbildung 8 Ergebnisse der GPU-Rekonstruktion berechnung
Timing-Ergebnisse: Die CPU dauerte 3,2 s und der Reprojektion fehler betrug 0,9849; Die GPU dauerte nur 0,9 s und der Reprojektion fehler betrug 0,9749.
5.2.2 Horizontales Verhältnis von CPU-und GPU 3D-Quer korrelation berechnungs ergebnissen. Abbildung 9 oben ist CPU und Abbildung 9 unten ist GPU
Abbildung 9 Ergebnisse der CPU-Kreuz korrelation berechnung
Abbildung 9 Ergebnisse der GPU-Kreuz korrelation berechnung
Timing-Ergebnisse: Die CPU dauerte 2,1 s, die GPU nur 0,8 s.
5.3 Experiment 3-Rührtes Wasserstrom feld (mehrere Partikel)
5.3.1 Horizontaler Vergleich der CPU-Voxel-Raum rekonstruktion und der GPU-Voxel-Rekonstruktion berechnungs ergebnisse. Abbildung 10 oben ist CPU, und Abbildung 10 unten ist GPU
Abbildung 10 Berechnungs ergebnisse für die CPU-Rekonstruktion
Abbildung 10 Ergebnisse der GPU-Rekonstruktion berechnung
Timing-Ergebnisse: Die CPU dauerte 35,6 s und der Reprojektion fehler war 0,9762; GPU dauerte nur 8,0 s und der Reprojektion fehler war 0,9723.
5.3.2 Horizontaler Vergleich der drei dimensionalen Ergebnisse der Berechnung der Kreuz korrelation von CPU und GPU. Abbildung 11 (oben) zeigt die CPU und Abbildung 11 (unten) zeigt die GPU.
Abbildung 11 Ergebnisse der CPU-Kreuz korrelation berechnung
Abbildung 11 Ergebnisse der GPU-Kreuz korrelation berechnung
Timing-Ergebnisse: Die CPU dauerte 76,0 s; GPU dauerte nur 11,4 s.
5.4 Experiment 4-Jet-Flow-Feld
5.4.1 Beim Vergleich der Berechnungs ergebnisse der CPU-Voxel-Raum rekonstruktion und der GPU-Voxel-Raum rekonstruktion kann die CPU nicht berechnet werden, die GPU benötigt etwa 20,0 s und der Reprojektion fehler wird als 0,9946 bewertet.
5.4.2 Die Ergebnisse der CPU-und GPU 3D-Kreuz korrelation berechnung werden horizontal verglichen. Die CPU kann immer noch nicht berechnet werden, und die GPU-Berechnung dauert etwa 40 Sekunden. Abbildung 12 zeigt die GPU.
Abbildung 12 Ergebnisse der GPU-Kreuz korrelation berechnung
5.5 Experimentelle Schluss folgerung
Nachdem die Berechnungs zeit der beiden Stufen kombiniert wurde, ist das horizontale Vergleichs ergebnis in Abbildung 13 dargestellt. Die Partikel sind relativ dicht und die GPU hat einen größeren Vorteil bei der Beschleunigung. In Experiment 4 kann die CPU nicht mehr berechnen, wenn die Partikel sehr dicht sind, aber die GPU kann die Voxel-Rekonstruktion 3D-Kreuz korrelationsoperation noch abschließen.
Abbildung 13 Vergleich des Zeit verbrauchs der Rekonstruktion kreuz korrelation berechnung in vier Versuchs gruppen
Die PIV-Durchfluss feld mess software von Revealer mit integrierter GPU-Beschleunigung stech no logie kann eine große Menge an Bilddaten gleichzeitig verarbeiten, um die Nutzung von Speicher und Cache zu maximieren. und eignet sich zur Berechnung komplexer Strömungs felder im drei dimensionalen Raum.
Angebracht ist die selbst entwickelte PIV-Flow-Feldmess-Software und-Hardware von Revealer
Selbst entwickelte PIV-Mess software, geeignet für 2 D2C, 2 D3C, 3 D3C, PTV, Blasen messung und andere Anwendungs szenarien
Autonome und kontroll ierbare PIV-Hoch geschwindigkeit kamera, ultra klare PIV-Kamera
English
Deutsch