können die Grundlage einer Ausweitung des Datenerfassungs- systems und der Fusionsmodelle bilden: 1. Wer nutzt das Gebiet? Es ist wichtig, dass bekannt ist, wer das Gebiet besucht – sowohl in Bezug auf die Verkehrsarten als auch auf die soziodemografischen Kategorien. Anhand der genutzten Verkehrsmodi kann bestimmt werden, welche physikalischen Sensoren installiert werden sollen, während soziodemografische Informationen nützlich sind, um even- tuelle Verzerrungen des digitalen Systems zu berichtigen. 2. Welche Transportinfrastruktur gilt es zu berücksichti- gen? Die Nutzung der Infrastruktur hat einen direkten Ein- fluss auf die Dimensionierung des Beobachtungssystems (Art, Anzahl und Position der Sensoren). 3. Was sind die möglichen Routen und Zugänge? Kenntnis der Infrastruktur reicht nicht aus, um sich ein vollständiges Bild der Mobilität zu machen, insbesondere, was Fussgänger betrifft, da diese sich freier bewegen können. Die wichtigs- ten Ein- und Ausgänge des Gebiets sowie Alternativrouten müssen unbedingt identifiziert werden. 4. Was sind die Anziehungspunkte des Gebiets? Unter An- ziehungspunkten versteht man Einrichtungen, Geschäfte und Infrastrukturelemente, die über alle Verkehrsmodi hin- weg Nutzer anziehen und zahlreiche Bewegungen erzeugen. Durch das Untersuchen dieser Punkte können die optimalen Standorte für Sensoren identifiziert werden, sodass ein mög- lichst grosser Anteil des Verkehrs erfasst werden kann. 5. Wo bestehen Lücken? Ein lückenloses Wissen über alle Aspekte des Gebiets ist nicht realistisch, und auch die leis- tungsfähigsten Sensornetze können nicht den gesamten Verkehr fehlerfrei darstellen. Es ist jedoch möglich, kom- plexe Aspekte, die bei der Erkennung der Verkehrsflüsse systematische Fehler generieren könnten (z. B. Hindernisse im Erfassungsbereich), vorauszusehen und dann Massnah- men zu ergreifen, um diese vor Projektbeginn zu beheben. Diese Liste deckt selbstverständlich nicht alle Fragen ab, aber sie erlaubt es, ein System zur optimalen Datenerfassung für grosse und dynamische Gebiete aufzubauen. Zudem hilft diese einfache vorgängige Analyse dabei, potenzielle Problemberei- che zu identifizieren. Dadurch wird eine gewisse Aussagekraft der Daten sichergestellt, und nötigenfalls können Massnah- men zur Verbesserung ihrer Qualität getroffen werden. qui doivent être mis en place, tandis que la connaissance des catégories sociodémographiques est utile pour corri- ger d’éventuels biais du système digital. 2. Quelles sont les infrastructures de transport à prendre en compte? La fréquentation des infrastructures aura un impact direct sur le dimensionnement de l’Observatoire (type, nombre et position des capteurs). 3. Quelles sont les itinéraires et accès possibles? La connaissance des infrastructures n’est pas suffisante pour avoir une vue complète de la mobilité, notamment en pré- sence de piétons qui sont peu contraints par l’espace phy- sique. L’identification des entrées et sorties principales dans la zone, ainsi que des alternatives d’itinéraires, est essentielle. 4. Quels sont les pôles d’attractivité de la zone? Par pôles d’attractivité, on entend tous les équipements, commerces et infrastructure qui attirent et génèrent de nombreux dé- placements, tous modes confondus. L’étude de ces pôles permet d’identifier naturellement les localisations opti- males des compteurs, où un maximum du trafic peut être détecté. 5. Quelles sont les lacunes? Il est évident qu’une connais- sance exhaustive de tous les aspects de la zone est im- possible, et même le plus performant des réseaux de capteurs ne peut représenter l’intégralité du trafic sans erreur. Cependant, il est possible d’anticiper et identifier des points complexes qui risquent de générer des erreurs systématiques dans la détection des flux (e.g. obstructions dans le champ de détection), et implémenter des mesures correctives en amont. Cette liste de questions n’est bien entendu pas exhaustive, mais permet de mettre en place une architecture de récolte de données optimale pour des périmètres larges et dynamiques, et éviter des écueils qui auraient pu être identifiés avec une simple analyse préliminaire. On garantit ainsi une certaine pertinence des données, et au besoin des mesures de correc- tion efficaces pour en améliorer la qualité. Références [1] R. Rollier, «A smart data product to monitor traffic», 2016. [Online]. Available: https://ict.swisscom.ch/2016/12/a-smart-data-product-to-monitor-traffic/. [Accessed: 11-Jan-2019]. [2] Lang Anthony, «Développement d’un observatoire de la mobilité utilisant des données de téléphones mobiles et d’autres senseurs: cas d’étude à Pully», EPFL, 2017. [3] F. C. Chan, «Using Mixture Models for Clustering», 2015. [Online]. Available: http://tinyheero.github.io/2015/10/13/mixture-model.html. [Accessed: 06-Jan-2019]. [4] P. Kirk, J. E. Griffin, R. S. Savage, Z. Ghahramani, and D. L. Wild, «Bayesian correlated clustering to integrate multiple datasets», Bioinformatics, vol. 28, no. 24, pp. 3290–3297, Dec. 2012. [5] A. P. Dempster, N. M. Laird, and D. B. Rubin, «Maximum likelihood from incomplete data via the EM algorithm», J. R. Stat. Soc. Ser. B, pp. 1–38, 1977. [6] F. C. Chan, «Fitting a Mixture Model Using the Expectation-Maximization Algorithm in R», 2016. [Online]. Available: http://tinyheero.github.io/2016/01/03/gmm-em.html#fitting-a-gmm-using-expectation-maximization. [Accessed: 06-Jan-2019]. 47