KFServing (KServe)
KFServing, Transformer, Predictor, Explainer
๋ณธ ๋ฌธ์๋ KServe 0.8 ๋ฒ์ ๊ธฐ์ค์ผ๋ก ์์ฑํ์๋ค.
KServe๋ Kubernetes์ ML Model์ Deployํ๊ณ Serving ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ Model Inference Platform์ด๋ค.
Control Plane
InferenceService CR ์์ฑํ๊ณ Kubernetes API Server์ ๋ฑ๋กํ๋ฉด, Transformer, Predictor, Explainer ๋ฑ์ ์์ฑํ์ฌ Inference Service ๋ฅผ ๊ตฌ์ถํ ์ ์๋ค. Knative Serverless๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํธ๋ํฝ์ด ์์ ๋๋ scale-to-zero ๋์ํ๋ค.
Inferenceํ ๋ฐ์ดํฐ์ ์์น๋ฅผ ์ ์ํ๋ค. Predictor์ ML Framework spec์ ์ ์ํ ํ endpoint spec์ ์์ฑํ๋ค. ์์ฑํ endpoint spec์ InferenceService Metadata spec์ ์์ฑํด InferenceService๋ฅผ ์์ฑํ๋ค.

Control Plane Components
Data Plane
KF Serving ๊ตฌ์ฑ์์๋ Endpoint, Transformer, Predictor, Explainer ๊ฐ ์์ผ๋ฉฐ Endpoint ๋ง๋ค Explainer ๋ฅผ ๊ตฌ์ฑํ๊ณ ํ์์ ๋ฐ๋ผ Transformer, Explainer ๋ฅผ ์ถ๊ฐํ ์ ์๋ค.
Endpoint
InferenceService๋ Default Endpoint์ Canary 2๊ฐ๋ฅผ ์ ๊ณตํ๋ฉฐ, Rollout ์ ์ฑ ์ ์ ์ํ์ฌ ํธ๋ํฝ ๋น์จ์ ์กฐ์ ํ ์ ์๋ค.
Transformer
์ฌ์ฉ์๊ฐ Predictor๋ Explainer ์ํ ์ ํ์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ, ํ์ฒ๋ฆฌ ํ ์ ์๋ค.
Predictor
ML Model Server๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ฑฐ๋ ๋ถ๋ฅํ๋ ์ญํ ์ ํ๋ค.
Explainer
XAI๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ฑฐ๋ ๋ถ๋ฅํ ๊ฒฐ๊ณผ์ ๋ํด ํ๋จ ์ด์ ๋ฅผ ์ ์ํ๋ ์ญํ ์ ํ๋ค.

API v1
Readiness
GET
/v1/models/
Response:{"name": , "ready": true/false}
Predict
POST
/v1/models/:predict
Request:{"instances": []} Response:{"predictions": []}
Explain
POST
/v1/models/:explain
Request:{"instances": []} Response:{"predictions": [], "explainations": []}
์ฐธ๊ณ ์๋ฃ
https://kserve.github.io/website/ https://www.kubeflow.org/docs/components/kfserving/ https://devocean.sk.com/blog/techBoardDetail.do?ID=163739
KFServing ์์ ์ ๊ณตํ๋ Endpoint, Transformer, Explainer, Predictor ์ธ์ ๋ ๊ตฌ์ฑ์์๋ฅผ ์ถ๊ฐํ ์์ ์ด๋ฉฐ, Outlier Detection ๋ ๊ทธ ์ค ํ๋์ด๋ค.
Last updated
Was this helpful?