적용 모델 요약
전문가 해석
현재 PoC는 실제 제조 데이터를 학습한 모델이 아니라, 원재료 조성 변화가 물성에 영향을 준다는 도메인 가정을 수식으로 만든 뒤 그 합성 데이터를 학습합니다. 따라서 화면의 예측값은 배합 AI의 업무 흐름을 설명하기 위한 샘플이며, 실제 품질 판단이나 생산 조건 결정에는 사용할 수 없습니다.
모델 설계 자체는 PoC로 적합합니다. Ridge는 작은 데이터에서 안정적인 기준 예측선을 제공하고, Gradient Boosting Stump는 특정 투입량 임계값 주변의 비선형 변화와 상호작용을 보완합니다. 실제 시스템으로 확장할 때는 이 구조를 기준 모델로 두고, 실험계획법 데이터와 양산 배치 이력을 추가해 검증 지표와 불확실성 추정까지 포함해야 합니다.
Mermaid 모델 아키텍처
flowchart LR A[배합 입력
6개 변수] --> B[정규화
평균/표준편차] B --> C[다항 특성 생성
선형 + 제곱 + 교호작용] C --> D[Polynomial Ridge Regression] A --> E[Gradient Boosting Stump
잔차 기반 약한 학습기 34개] D --> F[4개 물성 예측
인장강도/경도/점도/수축률] E --> G[비교 예측
임계값 기반 비선형 보정] F --> H[목표별 점수화] F --> I[리스크 판정
고점도/고수축/취성] H --> J[추천 배합 후보] I --> J classDef input fill:#edf4ff,stroke:#9db8e8,color:#17202a; classDef model fill:#f1f8f4,stroke:#93c6ad,color:#17202a; classDef output fill:#fff7e8,stroke:#d7ae67,color:#17202a; class A,B,C input; class D,E model; class F,G,H,I,J output;
React Flow 분석 맵
모델별 분석
| 항목 | Polynomial Ridge Regression | Gradient Boosting Stump |
|---|---|---|
| 역할 | 정규화된 조성값을 다항 특성으로 확장해 4개 물성을 안정적으로 예측하는 기준 모델입니다. | 잔차를 반복 보정해 Ridge가 놓치는 임계값성 변화와 국소 비선형성을 비교용으로 보여줍니다. |
| 특성 설계 | 1 + x + x² + xᵢxⱼ 구조입니다. 충전재와 가교제의 상호작용 같은 배합 효과를 단순하게 표현합니다. |
각 단계에서 하나의 변수와 threshold를 고르는 stump를 사용합니다. 설명 가능성은 좋지만 표현력은 제한적입니다. |
| 학습 방식 | (XᵀX + λI)^-1Xᵀy 형태의 Ridge 해를 계산합니다. 현재 λ는 0.25입니다. |
초기값은 평균 물성이고, 34라운드 동안 잔차를 학습합니다. 현재 learning rate는 0.12입니다. |
| 장점 | 작은 데이터에서도 과적합을 억제하고, 계수 기반 해석과 민감도 분석이 쉽습니다. | 비선형 구간, threshold 효과, 조건별 다른 반응을 직관적으로 설명할 수 있습니다. |
| 주의점 | 특성 범위를 벗어난 외삽에서 신뢰도가 급격히 낮아질 수 있습니다. | 단순 stump 기반이라 매끄러운 물성 곡면을 정밀하게 표현하기에는 부족합니다. |
민감도 분석 방식
현재 화면의 민감도는 특정 입력을 소량 증가시킨 뒤 예측값 차이를 계산하는 국소 perturbation 방식입니다. 예를 들어 원재료는 +1 phr, 촉매는 +0.2 phr, 온도는 소폭 변경해 물성 변화량을 보여주는 구조가 적합합니다.
실제 업무에서는 이 값을 계수 해석으로만 판단하지 말고, 배합 가능 범위, 점도 공정성, 경화 조건, 가격, 원재료 공급 안정성까지 함께 제약조건으로 넣어야 합니다.
추천 로직 해석
추천은 목표 모드별 점수 함수로 후보 배합을 평가합니다. 고강도, 저점도, 저수축, 균형 목표에 따라 인장강도와 경도는 가점, 점도와 수축률은 감점으로 처리합니다.
운영 시스템에서는 무작위 후보 탐색보다 Bayesian Optimization, constrained search, multi-objective Pareto front를 적용하는 것이 더 적합합니다.
운영 적용 로드맵
sequenceDiagram
participant Lab as 실험실/DOE
participant Data as 데이터셋
participant Model as 모델 학습
participant QA as 품질 검증
participant Prod as 생산 적용
Lab->>Data: 배합비, 공정조건, 물성시험 결과 수집
Data->>Model: Train/Validation/Test 분리 및 이상치 검토
Model->>QA: R2, MAE, 외삽 감지, 불확실성 평가
QA-->>Model: 기준 미달 시 추가 실험 설계
QA->>Prod: 승인 범위 내 추천 배합 적용
Prod->>Data: 양산 결과와 lot 편차 재학습 피드백
실서비스 전 보강 항목
| 구분 | 필요 보강 | 권장 기준 |
|---|---|---|
| 데이터 | 실측 DOE, lot 정보, 온습도, 혼련 조건, 경화 시간, 시험 장비 정보를 포함해야 합니다. | 최소 수백~수천 배치, 목표 물성별 반복 시험 포함. |
| 검증 | 학습/검증/테스트 분리, 시간 기준 holdout, 외삽 구간 경고, 재현성 평가가 필요합니다. | MAE와 R2 외에 공정 판정 오차율을 별도 관리. |
| 모델 | Gradient Boosting, Random Forest, Gaussian Process, XGBoost 계열을 실제 데이터로 비교합니다. | 예측 정확도와 설명 가능성의 균형을 기준으로 선정. |
| 운영 | 모델 버전, 학습 데이터 버전, 승인된 배합 범위, 변경 이력을 저장해야 합니다. | 배합 추천값은 승인 워크플로우를 거쳐 생산 반영. |