EINSIS는 필터링 샘플링 없이 전체 데이터를 처리하는 고성능 데이터 처리에 대한 원천 기술과 정규표현식 기반의 빠르고 효율적인 머신러닝 원천 기술을 보유하고 있습니다. 기존 머신러닝 기술은 다양한 데이터의 종류와 그 방대한 양을 실시간으로 범용 처리하지 못했기 때문에 제한적으로 머신러닝 기법을 적용하지만, EINSIS는 모든 데이터에 대해서 빅 데이터 분석하므로 머신러닝의 학습 효과를 제대로 발휘할 수 있습니다. 이렇게 처리된 데이터는 범용 언어인 정규표현식으로 분석합니다. 세계에서 가장 앞선 독보적인 정규표현식 고속 검색 기술, 패턴 생성 기술, 상관 관계 분석 기술 등을 다년간 연구하여 상용화하였습니다.
기존 인공지능은 처리 성능의 제약 때문에 머신러닝 전에 사람의
논리(로직)로 고안된 데이터 필터링 또는 샘플링이 필요합니다.
이러한 필터링 및 샘플링은 작업에 시간이 많이 걸리고 지속적으로
업데이트가 어려울 뿐만 아니라 작업한 사람의 편향(bias)이 내재되어
있습니다.
또한 샘플링은 다량의 정상 데이터 속에 소량의 비정상 데이터를 놓치게
되며, 정상 데이터와 비정상 데이터의 차이를 파악하지 못하는 한계를
가지고 있습니다.
AICE는 필터링/샘플링 하지 않고 전체 데이터를
머신러닝으로 분석함으로써, 과거 데이터와 실데이터를 전부
머신러닝으로 분석을 가능하게 하여 머신러닝 알고리즘의 강력함을
제대로 활용할 수 있도록 합니다.
AICE는 분석 결과로 클러스터/아웃라이어 및 이에 대응되는 정규표현식
탐지룰을 생성합니다.
생성된 정규표현식은 클러스터를 나타내며,
클러스터와 이를 나타내는 정규표현식은 후속 데이터와 피드백을 통하여
지속적으로 업데이트 됩니다.
AICE는 클러스터/아웃라이어를
정규표현식 비교 • 분류하므로 어떤 종류의 사전 지식(domain
knowledge)이라도 피드백에 활용될 수 있습니다.
AICE는 여러 위치로부터의 다양한 데이터 소스를 손쉽게 분산 처리할 수
있습니다, 또한 기존 결과를 정규표현식으로 인식하므로, 새로운
데이터를 분석할 때 기존 데이터를 반복하여 분석할 필요가 없어서
빠르고 효율적인 머신러닝이 가능합니다.
PCRE와 100% 호환되는
정규표현식을 사용하므로, 결과물인 정규표현식 결과는 타 시스템과
손쉽게 배포 및 공유할 수 있으므로 어떤 비즈니스 도메인에도 이식이
용이합니다.
• 패턴 인식 (Pattern recognition)
• 특허 기반의 초고속 계층 클러스터링 (Proprietary, High-speed,
Hierarchical clustering for space reduction)
• 비결정적 유한 오토마타 (Non-deterministic Finite Automata for
automated actions)
• 탐지룰 최적화를 위한 유전 알고리즘 (Genetic algorithm for
optimizing signatures)
• DBSCAN (Density-based spatial clustering of applications with
noise)
• OPTICS (Ordering points to identify the clustering structure)
• KNN (K-nearest neighbors: K-최근접 이웃) for identifying elements
in clusters
• 나이브 베이즈 (Naive Bayes for qualifying clusters)
• 서포트 벡터 머신 (Support Vector Machines for integrated
classification and qualification)
• 시퀀스 마이닝 (Sequence Mining for identifying correlated
events)