hkitalk.net 香港交通資訊網

標題: [客量統計學] 795X 客量分佈及變化 [打印本頁]

作者: castanopsis    時間: 2025-1-4 13:37
標題: [客量統計學] 795X 客量分佈及變化
本帖最後由 castanopsis 於 2025-1-4 14:20 編輯

1. Background

隔離帖拗到面紅耳赤
個個都引用 膠筒 既數據,然後各自得出唔同既結論
恰巧有學過statistics,索性整理返網上既數據,搵返一啲客觀既真相


2. Scope

首先定義返個研究範圍
膠筒 上面既數據,主要集中喺下午-夜晚往將軍澳方向
由於個dataset夠大先可以remove到各個variable既影響,我呢度亦集中返呢個時段

2024年,總共有63組數客數據
我收集曬 調景嶺落客數、將軍澳+清半落客數、區內流水客數
流水客本身唔多,主要係 調景嶺>將軍澳、尚德/將軍澳>清半,所以我當曬喺調景嶺以外落車
795X唔少客將轉落車,但數字飄忽,所以無納入統計


3. Methods

客量會受好多因素影響,最重要既,不外乎——
1. 日子(星期一定星期日)
2. 開車時間(繁時、晚飯後、夜繽紛)

宜家已經有唔少statistical model可以handle呢啲data
由於 開車時間~客量 呢類correlation,明顯係non-linear
所以我選擇用machine learning,用R.4.1.0砌random forest model

Random forest既其中一個強項
係可以攞partial dependence plot出來,逐個variable睇
舉個例,我如果想睇客量喺過去一年既升跌,可以砌 passenger number ~ day of year 既partial dependence plot
呢類plot已經幫我移除咗日子/開車時間既影響


4. Results/discussion

首先我地睇下
過去一年 調景嶺+將軍澳,客量既變化
藍線係改道既日期

(, 下載次數: 155)