다잇소


[소식] [KDS 직원인터뷰] AI 인공지능 알고리즘 구현 논문 내용을 소개하는 그룹사 IT운영부 맹국재 실장

2017.07.19
맹국재

 

우선 논문과 졸업 축하합니다.

맹국재 (이하 맹) : 감사합니다.

 

서강대학교  정보통신 대학원에 다니는 우리 직원들이 많은 것 같은데…



 

첫 번째 졸업자 인가요?

아뇨..박천일 실장이 있죠.

 

또 이창근 실장님이나 장인희 실장님이 다니고 계시죠?

예 이창근 실장님은 이번에 장학금 받는다고 하던데 올 A라고 하더라고요.

 

전공이 뭐죠?

정보보호 입니다. 보안이나 시스템 포렌징, 해킹 같은 내용들인데 사실 이번 논문은 소프트웨어 공학관련 논문이라고 볼 수 있어요. 인공지능 알고리즘을 이용해서 문서에 대한 자동분류를 하는 내용을 논문 주제로 잡았습니다.

 

논문 이야기가 나왔는데 어떤 내용인지 간단히 소개 부탁드립니다.

전자정보사이트에 다수의 글이 다양한 카테고리로 올라 오잖아요?  게시글에 대한 패턴을 분석해서 이 게시글이 어느 카테고리의 게시글인지 자동으로 분류해주는 거죠.

 

네, 논문에 대한 이야기는 뒤에 자세히 듣도록 하고 우선 이 과정을 공부하게 된 이유가 뭐죠?

회사에서 가까워서죠. 야간에 대학원을 가야 하는데 시간 맞춰 갈 수 있는 곳이 IT쪽으로는 연대 아니면 서강대 밖에 없어요.

연대는  회사지원이 50%이상이 되어야 하고 여름에 자비로 일주일간 해외연수를 가야해요. 한 학기 등록금도 1400만원이고… 현실적으로 다닐 수 있는 곳이 서강대였죠.

 

회사생활하면서 대학원 다니는게 쉬운일은 아닌데 졸업까지 하셨어요. 졸업해 보니 어떤가요?

제 경우에는 논문을 쓴게… 자기만족이 강한 것 같아요.

 

얼마전 마인즈랩이라는 인공지능 회사에서 보니 인공지능이라는게 수많은 정답데이타를 만들어 확률을 높이는 어찌보면 단순한 느낌이던데…

그렇죠 다양한 케이스의 질문에 대한 답을 정교하게 하는거죠. 결국은 정답데이타에 대한 커버리지를 갖는거죠.

 

특정 서비스나 시스템에는 일종의 특정한 인풋 패턴이 있으니 거기에 특화되어  발전시킬 수 있겠네요. 그런데 AI라는게 방대한 영역일텐데 주로 언어에 대한 영역을 많이 접하게 되는 것 같아요.

주로 언어죠. 글, 음성이 결국 언어니까요. 이미지도 있고 하지만 분석 방법은 소스를 백터데이터로 만들어서 데이터 특징을 찾아내고 결국 최종으론 선형회기나 분류알고리즘을 통해 예측을 하죠. (10분에 걸친 긴 설명)자세한 이야기는 앞으로 제가 다잇소에 연재할 내용에서 풀어보겠습니다.

 

 

쉽게 연재 부탁드려요. 벡터데이타… 차원데이타… 어렵네요^^



 

맹국재_01

 

연재라면 몇 편정도 예정하세요?

10회정도가 아닐까싶어요.

 

연재 내용에 대해서 간단히 말씀해주세요.

요즘 4차산업이라고 해서 여러가지 분야의 요소기술들이 주목받고 있잖아요. 그 가운데 인공지능 분야에 대해 이야기 해볼 생각입니다. 인공지능에서 제가 이야기하려는 문서분류 알고리즘에는  4가지 정도로 종류를 나눌 수 있는데 대략적인 특징을 설명하고  ‘신경망이론’이 어떻게 인공지능이 되는지 구현방법에 대한 이해가 부족하거든요. 그래서 쉽게 이해할 수 있게 설명해 드리고 싶습니다. 샘플코드도 일부 공개하고 더 자세히 다루면 어려워질 것 같고 연재에서 말씀드릴께요.

 

그룹내에서도 이러한 알고리즘이 필요한 부분이 있겠죠?

방화벽을 이야기 할 수 있죠. 해킹 같은 실제 거래가 있는 반면 계정을 탈취하려는 시도가 있을 수 있잖아요. 그것을 판단하는 데 AI알고리즘을 적용하는 거죠. 최근 정보보호쪽에서도 이슈가 되고 있는데 방화벽 로그를 실시간 탐지하는데 오판들이 많아요. 공격으로 들어온게 아닌데 공격이라고 판단을 한다거나, 공격로그에 대한 필터링 수준을 높이면 정상거래까지 필터링해 버립니다.

또 요즘 로보어드바이저 처럼 고객의 상담내용을 지속적으로 학습시켜서 최적화 된 상품을 소개한다던지 개인자산관리까지 가능한거죠.

 

그런 부분까지 연재에서 이야기 할 건가요?

포괄적이고 깊게 다룰 수는 없을 겁니다.  주로 논문에 쓴 문서분류 알고리즘에 대한 대략적인 설명하고 특성등에 대해 설명하겠지만 AI알고리즘에 어떤것들이 있고 그 특성들을 이용해 어떤 분야에 접목 시킬 수 있겠다 정도는 다룰 수 있겠죠.

 

 

 

맹국재_03

 

만약 직원들이 관련 분야에 대한 공부를 하고싶다면 어떻게 해야할까요?

지주에서도 직원들에게 학습시키려고 노력하는 것 같아요. 최근 지주에서 인공지능쪽 텐서플로우 위탁교육 신청자를 받는 걸로 알고 있어요. 현재 그룹내에도 관련해서 다양한 기회가 있을거라 생각되네요.

 

대학원에서 우수논문으로 지정되었다는 이야길 들었는데



 

술 한 잔 사셔야겠네요.

예 날 잡아주세요.

 

논문은 회사에 제출하나요?

회사에 논문을 제출한다고요?

 

 

자 그럼 아까 미루었던 논문 내용에 대해 소개해주세요.

우리나라에 73개 전자정부 사이트가 있어요. 이를테면 경찰청, 대법원 홈페이지 같은데 올라오는 민원 게시글이 있는데 이렇게 올라온 모든 글들을 업체에 보내서 수기로 분석하고 분류하는 작업을 현재 하고 있어요. 그런데 이 것을 인공지능 문서분류 알고리즘을 사용해 분류할 수 있도록 하는 내용이죠. 알고리즘중 복합모델을 사용하니 예측율이 얼마 더 좋아졌다. 이런 내용과 또 한글을 분석하는 텐서플로우라는 엔진을 돌리기 위한 데이타를 전처리 하는 과정들도 순차적으로 설명했고요.

 

 

인식성공률이 얼마나 되었죠?

제가 만들어서 구현한 것은 74%정도로 높지는 않지만, 게시판에 올라오는 글들은 정형화 되지 않아서 현재로서는 74%정도도 나쁘지 않은 수준이라고 합니다.

 

 

맹실장님은 와이즈리더이기도 하니 다잇소에 아이디어제안에 AI관련 아이디어가 올라올 경우 아이디어에 대한 의견을 줄 수도 있겠군요.

박사도 아니고 제가 부족한 부분이 많겠지만 어느정도의 지식은 함께 이야기하고 공유할 수 있을 것 같습니다.

 

 

예 오늘 인터뷰 감사드리고 앞으로 연재 기대하겠습니다. 

 

연재 소개편 부터 확인하세요.

 

 

맹’S Google 텐서플로우(Tensorflow)를 활용한 AI알고리즘 구현 – 소개편 1


http://daitso.kds.co.kr/60690/

 

 
daitso의 프로필 사진
| Administrator
관심분야 IT, 금융, 트렌드

KDS 지식공유 시스템 다잇소! 입니다.

카테고리 레이어 닫기