(우한갤펌) 청와대 정부응원 국민청원 조작 정황.jpg
(앞부분 조금 생략)
원글의 크롤링 틱이 1초일 경우 중복 계정 삭제나 캐싱, 동기화 등 요인으로
수치가 비정상적으로 보일 수 있다는 건의를 듣고 틱을 30초로 변경하여 자료를 수집하였습니다.
결과부터 보겠습니다.
(사진1: 탄핵촉구* 청원수)
(사진2:정부응원** 청원수)
KST 2020-02-27 12:23:25 경 탄핵청원 수치는 100만에 도달했고, 순간 데이터가 요동치기 시작합니다.
이전에 없던 마이너스 수치가 등장하고 이는 정부응원 수치도 동일합니다. 그래프로 한 번 보겠습니다.
(사진3 fig.1: 시간별 청원 증가수 변화량, 30초 간격)
빨간선은 KST 2020-02-27 12:23:25,
탄핵촉구 청원수가 100만을 최초로 넘긴 시점을 의미합니다. 해당 시점을 기준으로 fluctuation이 증가합니다.
이 그래프를 5분 이동합으로 보겠습니다.
(사진4 fig.2: 시간별 청원 증가수 변화량, 5분 간격)
적은 확률이라도, 트래픽 과다로 인해 서버간 렉 또는 기타 문제로
fig.1의 마이너스 수치가 발생할 수 있었다 하겠습니다.
fig.2의 그래프는 마이너스 수치가 발생하지 않아 이 문제는 논외로 하겠습니다. fig.2의 그래프는 탄핵촉구 청원 100만을 기점으로 파형이 변화하기 시작합니다. 두 청원수의 차이를 한 번 봐보겠습니다.
(사진5 fig.3: 시간별 탄핵촉구*, 정부응원** 청원 증가수 차이, 5분 간격)
탄핵촉구 청원수 100만 도달이후 두 청원수 증가 차이가
눈에 띄게 변화함을 볼 수 있습니다.
평균 500수준을 밑돌던 수치가 평균 1,000수준으로 2배 가량 증가하였습니다.
수많은 사람들이 아주 '우연히', 동시에, 탄핵촉구 100만 청원수에 맞춰, 계획한 것처럼 '동시에 움직였을 확률'도 있습니다.
그 확률이 얼마나 될지는 고려해봐야겠지만요.
해당 자료는 아래 코드와 raw data로 작성되었고
미디어 작성자나 기자분들의 자유로운 활용이 허용됩니다.
(code)
env.: win10, python3
1. chungwon.py https://pastebin.com/FVTRSY3K
2. eungwon.py https://pastebin.com/Ce5brwgr
(raw data)
format: tsv, 날짜t시간t청원수t1틱당변화량
1. 문재인 대통령 탄핵을 촉구합니다.(2020-02-04, ID:584936) *탄핵촉구
(https://www1.president.go.kr/petitions/584936?navigation=best) https://pastebin.com/uxQuVnQ1
2. 문재인 대통령님을 응원 합니다!(2020-02-26, ID:585683) **정부응원 (https://www1.president.go.kr/petitions/585683?navigation=best)
https://pastebin.com/24rnpxpU
출처: 스누라이프
핵심 문장:
탄핵촉구 청원수 100만 도달이후 두 청원수 증가 차이가 눈에 띄게 변화함을 볼 수 있습니다.
평균 500수준을 밑돌던 수치가 평균 1,000수준으로 2배 가량 증가하였습니다.
수많은 사람들이 아주 '우연히', 동시에, 탄핵촉구 100만 청원수에 맞춰, 계획한 것처럼 '동시에 움직였을 확률'도 있습니다.
그 확률이 얼마나 될지는 고려해봐야겠지만요.
진짜라면 ㅎㄷㄷ.....
원본글: https://m.dcinside.com/board/dngks/281009
* 도움팀/운영자에 의해서 게시물 이동되었습니다 (2020-02-27 19:55)