학회_공부해요/기술_스터디

[coupang] Optimizing the inbound process with a machine learning model

yenas0 2023. 5. 8. 01:00
반응형

https://medium.com/coupang-engineering/optimizing-the-inbound-process-with-a-machine-learning-model-2db48bbbc304

 

Optimizing the inbound process with a machine learning model

How we predict the adequate number of delivery trucks needed for vendors to send their products to Coupang’s fulfillment centers

medium.com


쿠팡은 물류 입고 프로세스의 최적화를 위해 기계 학습을 통한 직매입 제품들의 풀필먼트 센터 입고 프로세스를 개선해왔다. 

 

배경 및 과제

도크(dock) : 각 풀필먼트 센터네 트럭을 세워두고 물건을 하역하는 역할을 한다.

슬롯(slot) : 센터마다 시간대별로 사용 가능한 도크의 최대 개수는 정해져 있다. 제품 하역 작업 시 한 대의 트럭이 하나의 도크를 사용하는 정해진 시간을 의미한다.

 

제품이 효율적으로 입고되기 위해서는 각 입고에 필요한 슬롯의 개수가 사전에 예측되어야 한다.

if

예측한 필요슬롯 < 실제 필요 슬롯:

입고 과정에서 지연이 발생한다.

 

반대의 경우 슬롯을 낭비하게 된다.

 

==> 낭비되는 슬롯의 개수를 줄이고, 입고가 지연되는 문제를 최소화하기 위해 적정한 필요 슬롯 개수를 예측하여 제공하는 시스템을 개발하기로 하였다.

 

트럭 수량 예측 모델 학습하기

1. 그 동안의 데이터(실제 사용된 트럭의 수, 트럭 대수에 영향을 미치는 특징들)를 사용하여 학습 데이터를 구성하였다.

2. 적정 트럭 입차 수량을 예측하는 머신 러닝 모델을 학습시켰다.

3. 학습된 모델을 입고 예약 시스템과 연결하여 업체가 입고 신청을 하면 시스템을 통해 적정 트럭 대수를 확인 할 수 있도록 설계하였다.

 

특징 추출

쿠팡에 축적된 대량의 물류 데이터들로부터 트럭 수량 예측 모델에 적합한 특징들을 찾아내기 위해 탐색적 데이터 분석 과정을 거쳤다. 또한 물류 담당자들과의 인터뷰를 통해 물류 입고 과정에서 나타다는 패턴을 파악하여 트럭 수량 예측에 활용하기 위한 특징들을 발견했다. 

 

모델 학습: LightGBM 알고리즘

약 2년여간 추출한 데이터는 80만 건 정도이다. 데이터 세트의 크기가 작지 않기 때문에 빠른 학습과 튜닝이 가능한 알고리즘을 찾았다. => LightGBM 알고리즘

LightGBM : 트리 기반 부스팅 모델이다. 트리를 수직적으로 확장하는 leaf-wise tree growth방식을 사용한다. level-wise tree growth 방식과 달리 각 트리 깊이가 모두 확장될 때까지 기다리지 않고 가장 손실이 높은 리프 노드를 분할해 나가며 수직으로 확장하여 학습 속도가 빠르다는 특징이 있다. 또한 Fisher 알고리즘을 적용해 데이터의 클래스를 최적으로 분할하는 학습을 수행한다.

 

모델 하이퍼 파라미터 탐색 : 베이지안 최적화

베이지안 최적화(Bayesian Optimization) : 목적 함수 f의 함수 값 f(x)를 최대로 만드는 입력 값 x의 전역 최적해 x*를 찾기 위한 방법이다. 목적 함수가 명시적이지 않고 함수 값f(x)의 계산 비용이 클 때 최적해를 효과적으로 찾아낼 수 있다.

최적의 하이퍼 파라미터 조합을 찾아내기 위해 베이지안 최적화 과정을 한 달 주기로 새로운 데이터들을 추가 반영하여 모델을 업데이트하게 된다.

 

입고 예약 시스템과 모델 연계 구성

모델은 SageMaker에서 학습된다. 

https://aws.amazon.com/ko/sagemaker/

 

기계 학습 - Amazon Web Services

Amazon SageMaker는 제품 추천, 개인화, 지능형 쇼핑, 로봇 공학, 음성 지원 디바이스를 포함하여 20년에 걸친 Amazon의 실제 기계 학습 애플리케이션 개발 경험에 기반하여 구축된 서비스입니다.

aws.amazon.com

 

업체가 입고 예약 시스템으로 슬롯 예약 신청을 하면, 예약 시스템은 SageMaker엔드포인트를 호출해 모델 예측 결과 값을 반환 받아 업체에게 적정 트럭대수를 알려준다.

 

과소 예측과 과대 예측 사이의 트레이드 오프

기계 학습 예측 모델을 필연적으로 오차를 동반한다. 쿠팡의 기본적인 목표는 과대 예측을 줄이는 것이나, 업체 입장에서는 너무 적은 슬롯이 배정된다고 느끼게 될 수 있다. 따라서 과소 예측 비율을 유지하면서도 과도 예측을 최대로 줄이는 방식을 택하였다.

 

모델 적용 결과

모델 적용 전과 후를 위의 표로 확인한 결과 과소 예측과 과대 예측의 비율이 개선된 것을 알 수 있다.

 


마치며

방금도 쿠팡으로 아침햇살시키려고 보고 있었는데, 물건이 소비자에게 오기 전 입고될 때부터 이런 시스템을 거쳐 오게되는구나를 알게 되었다. 계속 데이터를 쌓아 업데이트 한다고 했는데 그럼 앞으로는 더 과소 예측과 과대 예측의 비율이 줄어들겠구나 싶었다. 또한, 아마존을 전자상거래를 주로하는 기업이라고만 알고 있었는데 기계학습 시스템을 지원한다는 것도 알게되었다. 많은 기업들이 이러한 기계학습 모델을 활용한다면 더 경제적인 기업 운영이 가능할 것 같다.

반응형