Breaking News
Blogs
  • xls이나 xlsx를 읽는 패키지들

    this is excerpt test ...

    this is excerpt test ...

    Read more
  • 지난 포스팅에서 최대가능도법의 개념에 대해 간략히 설명했습니다. 반복하자면, 최대가능도법은 자료가 있을 때 그것을 가장 잘 설명하는 모수치의 값을 찾는 것을 목표로 하고, 구체적으로 가능도 ...

    지난 포스팅에서 최대가능도법의 개념에 대해 간략히 설명했습니다. 반복하자면, 최대가능도법은 자료가 있을 때 그것을 가장 잘 설명하는 모수치의 값을 찾는 것을 목표로 하고, 구체적으로 가능도함수를 최대화하는 모수치의 값을 구하는 방식으로 이루어진다고 했습니다. 보통 미분을 통해 이 최대화 문제를 해결한다고 설명하는 경우가 많은데, 이 "미분"이라는 말이 주는 ...

    Read more
  • 지난 포스팅에서 최대가능도 추정법을 정규분포에 적용한 간단한 사례를 살펴보았습니다. 하지만 아무도 정규분포의 평균과 분산을 추정할 때 굳이 최대가능도 추정법을 사용하지 않을 것입니다. 표본 ...

    지난 포스팅에서 최대가능도 추정법을 정규분포에 적용한 간단한 사례를 살펴보았습니다. 하지만 아무도 정규분포의 평균과 분산을 추정할 때 굳이 최대가능도 추정법을 사용하지 않을 것입니다. 표본평균, 표본분산이 있는데 왜 굳이 이런 힘든 수고를 겪어야 할까요? 게다가 이 값들은 최대가능도 추정치와 완전히 일치하거나, 조금만 조정하면 최대가능도 추정치로 만들 수 ...

    Read more
  • 추천 시스템 : 사트남 알랙과 ReadWriteWeb 인터뷰 번역글

    원래 이 인터뷰 내용은 ‘실전 예제로 살펴보는 집단지성 프로그래밍’ 에 포함될 내용이었는데, 개인적인 생각으로 인터뷰글을 책에 넣는 것보다 적절한 시기에 블로그에 공개를 하는 게 나을 거 ...

    원래 이 인터뷰 내용은 ‘실전 예제로 살펴보는 집단지성 프로그래밍’ 에 포함될 내용이었는데, 개인적인 생각으로 인터뷰글을 책에 넣는 것보다 적절한 시기에 블로그에 공개를 하는 게 나을 거 같다는 생각에 이렇게 공개를 해본다. 원문은 이곳에서 확인해 볼 수 있다. 이번에 번역 출간된 ‘실전 예제로 살펴보는 집단지성 프로그래밍’이 어떤 내용을 담고 있는지 직접 ...

    Read more
  • R로 구현한 맥주 추천 엔진

    데이터가 공개되면 이를 이용한 여러 재미있는 분석작업을 할 수 있다. 얼마전에 R기반 맥주 추천 구현 포스팅을 보고 몇일전에 관련 데이터 소스를 구해서 이에 대한 추천엔진 구현 포스팅을 올 ...

    데이터가 공개되면 이를 이용한 여러 재미있는 분석작업을 할 수 있다. 얼마전에 R기반 맥주 추천 구현 포스팅을 보고 몇일전에 관련 데이터 소스를 구해서 이에 대한 추천엔진 구현 포스팅을 올려본다. 이 데이터의 출처는 Beer Advocate이며 데이터 소스는 web data library이다. 사실 금번 분석의 동기는 데이터마이닝 수업 텀 프로젝트임을 미리 ...

    Read more
  • 국토교통부 실거래가 데이터 크롤링 코드

    국토교통부 실거래가 데이터 스크래핑 코드를 공유한다. 블로그에 썼던 데이터 분석에 사용한 데이터는 친분이 있는 분으로 부터 받은 데이터인데, 새로운 매매 데이터가 올라가면서 매번 요청하기 ...

    국토교통부 실거래가 데이터 스크래핑 코드를 공유한다. 블로그에 썼던 데이터 분석에 사용한 데이터는 친분이 있는 분으로 부터 받은 데이터인데, 새로운 매매 데이터가 올라가면서 매번 요청하기 힘들것 같아서 코드를 작성해 봤고, 아래와 같이 간단하게 스크래핑 코드를 만들 수 있었다. 데이터 스크래핑 코드는 항상 그렇듯이 임시방편적이고, 코드가 깨끗하지 않다. 그 ...

    Read more
  • 지난번 포스팅을 통해서 얻은 데이터와 그 이전 포스팅의 아파트 매매가에 미치는 층수, 크기, 년도 효과에 대한 분석의 후속 분석으로 같은 데이터를 기반을 하는 분석이지만 2015년 Q1의 ...

    지난번 포스팅을 통해서 얻은 데이터와 그 이전 포스팅의 아파트 매매가에 미치는 층수, 크기, 년도 효과에 대한 분석의 후속 분석으로 같은 데이터를 기반을 하는 분석이지만 2015년 Q1의 데이터가 어느정도 모였으니 이의 가격동향과 더불어 다중 회귀모형의 비선형적인 효과를 좀더 다른 방식의 알고리즘으로 모델링 해보고 시각화 해보는 과정을 거쳐보도록 하겠다. ...

    Read more
  • 띄어쓰기는 형태소 분석 이전에 반드시 수행해야 되는 중요 전처리 과정중에 하나이며, 이 때문에 공개된 형태소 분석기에는 일종의 자동띄어쓰기 모듈이 숨겨져 있는 경우가 많다. 하지만 그런 띄 ...

    띄어쓰기는 형태소 분석 이전에 반드시 수행해야 되는 중요 전처리 과정중에 하나이며, 이 때문에 공개된 형태소 분석기에는 일종의 자동띄어쓰기 모듈이 숨겨져 있는 경우가 많다. 하지만 그런 띄어쓰기 엔진의 성능이 대부분 좋지 않아 허울뿐인 경우가 많다. 필자가 만든 KoNLP 역시 그중에 하나였다. 물론 띄어쓰기는 형태소 분석 이전에만 사용하는게 아니다. 띄어 ...

    Read more