SAS

SASのクソな部分をぶった切る!(9)SASユーザー総会の歴史

SASユーザー総会久しぶりに見てみたら結構大きな変更が発生していますね。
まあ何があったのかは大体予想がついているのですが。。。

このあたりは記事にするかどうかは未定ですが(普通に忙しい)、これまでの活動実績を改めて把握しておいてもいいかなと思い、今回はSASユーザー総会のこれまでの開催状況を調査してみました。

調査概要

1982年から2022年までのSASユーザー総会のプログラムに記載された演題と著者を収集しました。

また演題のジャンルと著者の所属先の区分をプログラムに記載された名称と演題名などから作成しました。
ただ複数の区分に該当する演題もあるのでそこまで区分は正確ではないかもしれません。
医薬と社会経済は少なくともしっかり区別できていると思います。

経済、社会、マーケティングは厳密に区別することが難しいので、こちらはまとめたほうがよさそう。

医薬と統計解析の両方に該当する演題は医薬に区分しています。
東レのような化学メーカーだけど製薬事業もある場合は、所属区分はその他(製造業)にしています。

基調講演はおそらく招待されて発表しており、自発的に参加しているわけではないと判断したため除外しました。
またLet’sデータ分析は初期は実施しておらず、含めると最近開催分だけ演題数と著者数が上振れするためこちらも除外です。

あくまで論文とポスター発表のみを対象としています。

ネットから入手可能な記録のうち最古の記録は1982年でした。
こうして考えるとSASユーザー総会って40年も続いていたんですね。

結果

のべ著者数と演題数の推移

まず著者数と演題数の40年間の推移をグラフにしてみました。

始まった当初は演題数は少なかったですが、その後は2006年までは40~70の範囲で推移していました。年によっては70近くあったんですね。
2007年から2013年までは演題数が40を下回っていましたが、その後演題数は増加し、2017年にピークを迎えました。

しかしその後は演題数は減少、直近3年の演題数は過去最低のレベルになっています。
2020年は演題数は6しかなく初回の1982年よりも下回っています。

直近の演題数の少なさは新型コロナウィルス流行のため自粛していたためでしょうから、まあこれはしょうがないでしょうね。

のべ著者数も演題数と同様の傾向をしていました。基本的に1つの演題に対して複数の著者がいるケースが多いようです。

2007年から2013年あたりは演題数が伸び悩んでいたものの、コロナウィルス関連の事情を除けば演題数と著者数は一定の範囲で推移しており、
減少傾向はみられませんでした。

少なくとも演題数を見る限りは過疎っているわけではないようです。

所属別著者数の推移

年別および著者所属別の著者数の推移を見てみました。

所属=その他は製造業、サービス業が含まれています。情報処理関係やコンサル、シンクタンク、官公庁はこちらに区分されます。
なおIT業界であってもCRO業務を実施している場合はCROに区分しています。

まずは年ごとの著者数の割合。
割合は年ごとののべ著者数に対する割合です。

以前はその他業界の割合が多かったのですが、現在はやはり製薬業界(製薬会社、CRO)が最も占めています。
SASを使う主要業界として金融が挙げられますが、SASユーザー総会参加者はもともと少なかったです。

金融の場合は、銀行とか証券会社ではなく傘下のSIerやコンサル会社が発表していると思われるので、参加者の所属でみると
ほとんどいないように見えているようです。

各業界ごとの推移を見てましょう。まずはSAS社。
SAS社って以前は多くの発表者を出していたんですね。知りませんでした。
2005年までは毎年それなりに発表していたようで多いときは30人近く著者として参加していたようです。しかし2005年以降は良くて数人って感じです。何かあったんですかね。

一方製薬業界は年々著者数が増加しています。まあコロナのせいで直近は激減していますが。特に2010年あたりから急激に増えています。製薬業界団体が複数の演題を発表したりしていましたから、
その影響だと思います。

その他業界と大学はSASほどではないですが若干減少傾向です。2010年あたりでいったん大きく減少しその後少し持ち直しましたが、それでも90年代ほどではなかったです。
2000年以降の減少は大学よりもその他業界のほうが顕著でした。大学は2005年あたりで過去最高を記録しましたが、その後減少しています。

データを見ると90年代は製造業界、建設業界、航空業界など参加が多かったのですが2000年以降は
めっきり減っていますのでその影響かも。

意外だったのは90年代は官公庁や自治体からの発表もちらほらありました。以前は本当に多くの分野の参加者がいたんですね。

2000年までは多くの産業から参加しており、全日空、三菱UFJ銀行、野村総合研究所、キリンビール、新日本製鐵といった日本を代表する企業も参加していました。
それ以降は実質医薬専門の学会になっていったようです。2000年ごろが大きなターニングポイントだったのかな。

分野別演題数の集計

過去40年間の分野別演題数を集計しました。極力プログラムに記載された分野で集計していますが、時代によって分野区分が異なるので演題のタイトルからして明らかな場合は
タイトルから分野を決定しました。

分野 演題数 割合
医薬 493 27.7
SASシステム 411 23.1
統計解析 226 12.7
マーケティング 145 8.2
経済 78 4.4
金融 67 3.8
グラフィック 61 3.4
チュートリアル 57 3.2
教育 51 2.9
一般アプリケーション 35 2
その他 34 1.9
品質管理 32 1.8
データベース 15 0.8
データマイニング 13 0.7
経営 9 0.5
AI 9 0.5
リスク管理 8 0.4
オープンデータ 8 0.4
応用システム 7 0.4
プラットフォーム 4 0.2
疫学 4 0.2
システム 3 0.2
社会 3 0.2
ビジネス活用 2 0.1
CPE 2 0.1
ビジネスインテリジェンス 1 0.1
公衆衛生 1 0.1
合計 1779 100

分野別演題数(1982~2022)

統計解析とSASシステムは多くの演題で医薬品開発向けのものだったので過去40年間で発表された演題のうち少なくとも半分は医薬品開発関係だと考えてよさそうです。
直近の発表だけみると大半が医薬品関連じゃないの?と思われるかもしれませんが、80年代、90年代は医薬以外の演題も多かったのでこのような結果となりました。

なお「一般アプリケーション」や「データベース」というのはSASシステムを業務システムに組み込む方法についての発表のようで、最近のSASシステム分野の発表とはまた別の分野です。
windows95やoffice製品が普及する前は市販ソフトの選択肢も多くはなかったでしょうから、各社で独自のシステムを開発していたのでしょう。

分野別年別の演題数の推移

次に分野別に演題数の推移を見てましょう。
分野が多いので、分野を以下のように修正しました。

「公衆衛生」「疫学」は「医薬」にまとめました。
「社会」と「経済」は厳密に区別することが難しかったので「社会経済」としてまとめました。
「教育」と「チュートリアル」は「教育・チュートリアル」でまとめました。チュートリアルはSASシステムにも入りそうなので微妙なとこですが、教育的側面があると思うので教育と一緒にしました。
上記の区分と「金融」「マーケティング」に該当しない区分はすべて「その他」にしました・

医薬とそれ以外の分野を比較していきます。

90年代中頃まではSASシステムのほうが医薬よりも演題数が多かったですが、その後逆転しています。ユーザー総会開催初期のころはproc glm, proc mixedといったプロシジャの紹介や新パッケージの紹介もありましたし、著者も医薬以外の分野の方がそこそこいた時代ですから、妥当な結果でしょう。

医薬は年々演題数が増加していったのに対し、統計解析は2017年を除きほぼ一定の水準で演題数が推移していました。2017年だけ大きく演題数が多いですが、これは生存時間分析の発表は特に多かったことが原因でした。ソフトウェアや業界のトレンドとはあまり関係ない分野ですからこれも妥当かな。

社会経済と金融は昔からもともと演題数が多くなく、こちらも一定の水準で演題数が推移していました。演題数が少ないので減少傾向はないといっていいか微妙なところですが、現代においてもこの分野でSASは使われていることが再確認できました。

マーケティングは2000年ごろに演題数がピークに達しましたが、その後減少し、2015年以降演題数は0となりました。

社会、経済、金融と異なり調査・マーケティング分野ではSASを完全に使わななくなったのでしょうか?

まあRやpandasもありますし、tableauのようなプログラミングしなくても使えるBIツールもありますから「まあそうなっちゃうよね」という印象です。
SASのライバルが多すぎです。

最後にその他ですが、傾向としてはSASシステムと同様です。

結果の要約

  • 著者数および演題数はコロナウィルス流行以前までは明確な減少傾向はなかった。2010年ごろに著者数、演題数ともに落ち込んだがその後復活している。
  • SAS社は2005年ごろまでは積極的に演題を発表していたが、2005年以降は大幅に減少している。
  • 製薬会社・CROに所属する著者数は年々増加傾向であり、特に2010年以降から急激に増えている。
  • 製造業などのその他業界の著者数は2000年以降減少傾向である。2005~2010年頃若干持ち直したが、依然として減少傾向である。
  • 金融業の著者数は過去40年一貫して少ない
  • 過去40年の演題は少なくとも半分は医薬品関連。分野区分の都合上実際はもっと多い可能性がある。
  • 製造業や業務システム関連などの演題数は90年代前半までは医薬関連よりも多かったがその後は逆転している。2000年以降はその差が拡大している。
  • 社会経済、金融、統計解析の演題数は過去40年で大きくは変化していない。
  • SASシステムおよびその他の分野の演題数は90年代半ばまでは医薬よりも多いがその後逆転している。
  • マーケティングは2000年頃に演題数のピークを迎えたがその後減少し2015年以降は演題数は0となっている。

まとめ

演題数と著者数だけ見ればSASユーザー総会はコロナ流行前までは衰退している事実は確認できませんでした。

演題の内容や著者の所属先は開催当初から大きく変化しており、現在はほぼ医薬専門の学会だということを再確認しました。

SASユーザー総会は2000年頃と2010年頃に大きな変化を経験していることがわかりました。

2000年頃は医薬以外’(メインは製造業)の参加者数の大幅な減少。

2010年頃は医薬品関連の発表の大幅な増加。

そのあとSAS社の発表者数大幅減少とマーケティング分野の発表者数ゼロというイベントが発生していました。

10年間隔で大きな変化が起こっていますから次は2020年です。

すでにコロナの影響でオンライン開催の変更を余儀なくされましたし、今年はついに世話人会も大きく体制変更を迫られてますから、今後大きな変化を目撃することになるかもしれませんね。