Diplomarbeit am Lehrstuhl für Datenverarbeitung, Technische Universität München, 2013
Currently the most reliable method of determining the visual quality of video sequences is subjective testing with human observers. Since this is both time-consuming and expensive, there is ongoing research on objective video quality metrics that allow to measure the visual quality without carrying out subjective tests. A very promising approach in the field of no-reference video quality metrics are metrics based on data analysis rather than on modeling the human visual system. It has been shown that the results improve when taking the temporal structure of the video sequence into account using multi-way data analysis methods.
In this thesis I show a way of refining multi-way quality metrics based on the extraction of H.264/AVC bitstream features by considering the internal GOP-structure of the coded video. Normally, metrics based on multi-way data analysis require both the sequences in the training set and the unknown sequence whose quality is to be predicted to have exactly the same length. By splitting the video sequences into their GOPs, the metric can be made length-independent and therefore more suitable for real-life applications while at the same time maintaining the performance.
Furthermore, the GOP-based quality metric can be used to predict the temporal progression of the visual quality. In order to evaluate this quality estimation, I present a new subjective test method that allows the assessment of quality fluctuations in short video sequences since existing methods like SSCQE are not suitable for this task. Instead of directly asking the observers about the continuos quality, I ask them about their overall quality impression, their impression of the quality fluctuation strength, and give a choice of different patterns that represent possible shapes of quality curves. From the answers to these three questions, the curve of the temporal quality can be reconstructed. Finally, I compare the results of this subjective test to the quality estimations of the GOP-based metric. It turns out that the results of both quality measurements are highly correlated.
Die derzeit zuverlässigste Methode, die visuelle Qualität von Videosequenzen zu bestimmen, ist die Durchführung subjektiver Tests mit Testpersonen. Da dies sowohl zeitaufwändig als auch teuer ist, gibt es laufend Forschung zu objektiven Videoqualitätsmetriken, die die Messung von Videoqualität ohne subjektive Tests ermöglichen. Ein vielversprechender Ansatz im Bereich der No-Reference Videoqualitätsmetriken sind Metriken, die auf Datenanalyse und nicht auf der Modellierung des menschlichen Sehsystems (Human Visual System, HVS) basieren. Es konnte gezeigt werden, dass sich die Ergebnisse verbessern, wenn man die zeitliche Struktur einer Videosequenz mittels multi-way Datenanalysemethoden mit in die Modellierung einbezieht.
In dieser Arbeit zeige ich, wie man multi-way Qualitätsmetriken, die auf der Extraktion von Merkmalen aus H.264/AVC-Bitstreams basieren, verbessern kann, indem man die interne GOP-Struktur des kodierten Videos berüksichtigt. Normalerweise setzen Metriken, die auf multi-way Datenanalysemethoden basieren, voraus, dass die Sequenzen im Training-Set und die Sequenz deren Qualität zu messen ist, die gleiche Länge besitzen. Teilt man die Videosequenzen in ihre GOPs auf, kann man die Metrik längenunabhängig machen und damit ihre Anwendbarkeit auf reale Probleme verbessern, ohne dabei ihre Leistung zu verschlechtern.
Darüber hinaus können GOP-basierte Qualitätsmetriken verwendet werden, um den zeitlichen Verlauf der visuellen Qualität zu bestimmen. Um diese Qualitätsschätzung zu untersuchen, stelle ich eine neue subjektive Testmethode vor, die es erlaubt, Qualitäts- schwankungen in kurzen Videosequenzen zu messen, da bereits existierende Methoden wie SSCQE in diesem Fall nicht ausreichend gut funktionieren. Anstatt die Testpersonen direkt nach ihrer Einschätzung der zeitkontinuierlichen Qualität zu fragen, stelle ich drei Fragen: eine nach der Qualität des Videos insgesamt, eine nach ihrer Einschätzung der Schwankungsstärke der Qualität und eine nach dem groben Verlauf der Qualität anhand von verschiedenen vorgegebenen Optionen. Aus den Antworten auf diese Fragen lässt sich der zeitliche Verlauf der Qualität rekonstruieren. Abschließend vergleiche ich die Ergebnisse aus diesem Test mit der Qualitätschätzung der GOP-basierten Metrik. Es zeigt sich, dass die Ergebnisse beider Verfahren hoch korreliert sind.