
최근 AI와 데이터 분야에서 합성 데이터 이야기가 정말 많이 들린다. 개인 정보 보호나 데이터 불균형 문제를 해결할 수 있는 '만능 치트키'처럼 여겨지기도 한다. 실제 기업 데이터를 구하는 것은 생각보다 많은 비용을 요한다. 개인이 데이터를 산다는 것은 상상할 수 없는 금액이다.하지만 ChatGPT한테 "쇼핑몰 고객 데이터 10만 개 만들어줘"라고 하면 정말 만들어준다. 개인정보 걱정도 없고, 원하는 조건도 마음대로 넣을 수 있다. 문제는 이게 정말 믿을 만하냐는 거다. 나 또한 합성 데이터를 굉장히 매력적으로 느끼고, 내 마음대로 생성해서 사이드 프로젝트나 해볼까 싶다가도 과연 얼마나 실제 산업에 적용 가능한 결과일지 감이 안와 머뭇대곤 한다. 그리고 왜 이렇게 유리과일과 이상한 키보드들을 만드는 데이..