#寫字練習100x100 (3/100)
週末在家開了小小 R 工作坊,結束後閒聊,發現大學時期不同科系訓練過程造成大家對於資料、分析、圖表的感覺有很大的差異,大部份理組科系有大量實驗課必修,每週都在畫圖、畫迴歸線、分析圖表(雖然在助教眼中大多只是唬爛),比如教 R 時請大家練習迴歸線,這個在理組實驗課中每週實驗報告必出現的名詞,對非理組科系的同學來說大概跟外星語差不多。
直條圖、折線圖、散布圖、迴歸線,這些每天在課本上、實驗報告中出現的圖表,大部份理組科系的畢業生即使並不熟悉理論上的定義,但操作都像是膝反射:折線圖是時間序列、直條圖比較類別、迴歸線提示相關性(相關不等於因果!)、不能亂丟極端值(outlier)。
記者朋友也分享,前陣子發表了帶圖表的新聞時,立刻有許多理組背景朋友的私訊湧入:「比起人次,比例的呈現或許更好。」「用 A 增加的人數來當作 B 減少的證據可以,但可能需要檢查減少的人數和增加的是不是差不多。」讓他驚覺不同專業養成過程的差異。
-
工作坊兩個小時能走的進度比想像中慢,本來想快速交代基礎指令之後帶大家直面我自己學習過程中最痛苦的部分:直接找個題目來做。畢竟 tutorial 的資料總是完美,許多眉眉角角實戰才會遇到,熟練者的小問題常常卻是初學者放棄的最後一根稻草。不過練習完兩次資料之後時間就差不多了,只好留待下次囉。
我覺得 R 不難,上手之後要學 Python 甚至使用 Command Line 也不會太難,最難的大概就是起步時超陡峭的學習曲線吧,要先不討厭、不害怕、覺得好玩、覺得自己可以,從中找到樂趣之後要自學就容易很多。
工具就是要為人所用呀,不想要工具跟事物的詮釋權被留在小圈圈之中,如果大家都會一點 R,溝通或許就更容易了,玩資料而生的新想法新題材或許就更多了,這個世界就會更有趣一點吧。
沒有留言:
張貼留言