'분류 전체보기' 카테고리의 글 목록 (11 Page)

분류 전체보기

[다차원 자료구조 응용] 히스토리 클래스에 적합한 다차원 자료구조

코드수집가 2024. 10. 22. 18:06

2024. 10. 22. 18:06

파이썬에서 히스토리 클래스는 일련의 데이터를 시간 순서대로 저장하고 관리하는 기능을 수행하는 클래스일 것입니다. 예를 들어, 사용자의 작업 이력이나, 시간에 따른 데이터 변화 등을 기록하고 조회할 수 있는 클래스입니다. 이와 같은 목적을 위해 적합한 다차원 자료구조에는 다음과 같은 것들이 있습니다.

1. 리스트의 리스트 (2차원 배열)

리스트를 사용하여 각 타임스탬프에 해당하는 데이터를 2차원 리스트로 저장할 수 있습니다. 각 서브리스트는 하나의 타임스탬프에서 저장된 데이터를 나타냅니다.

예시:

class History:
    def __init__(self):
        # 히스토리를 저장할 2차원 리스트
        self.history = []

    def add_record(self, timestamp, data):
        # 기록을 추가
        self.history.append([timestamp, data])

    def get_record(self, index):
        # 특정 인덱스의 기록을 조회
        return self.history[index]

# 히스토리 클래스 사용 예시
h = History()
h.add_record("2024-10-22 10:00", {"temperature": 20, "humidity": 50})
h.add_record("2024-10-22 11:00", {"temperature": 21, "humidity": 55})

# 첫 번째 기록 조회
print(h.get_record(0))  # 출력: ['2024-10-22 10:00', {'temperature': 20, 'humidity': 50}]

2. 딕셔너리의 리스트

시간 순서와 데이터를 연결할 때 딕셔너리를 사용할 수 있습니다. 각 타임스탬프를 키로 하고 그에 해당하는 데이터를 값으로 저장할 수 있습니다.

예시:

class History:
    def __init__(self):
        # 히스토리를 저장할 딕셔너리
        self.history = {}

    def add_record(self, timestamp, data):
        # 기록을 타임스탬프를 키로 하여 딕셔너리에 저장
        self.history[timestamp] = data

    def get_record(self, timestamp):
        # 특정 타임스탬프의 기록을 조회
        return self.history.get(timestamp, "기록 없음")

# 히스토리 클래스 사용 예시
h = History()
h.add_record("2024-10-22 10:00", {"temperature": 20, "humidity": 50})
h.add_record("2024-10-22 11:00", {"temperature": 21, "humidity": 55})

# 특정 시간 기록 조회
print(h.get_record("2024-10-22 10:00"))  # 출력: {'temperature': 20, 'humidity': 50}

3. 큐(Queue)를 사용한 시간 기반 자료구조

시간에 따라 자료가 축적되는 히스토리 구조에서, 최신 데이터와 오래된 데이터를 구분하여 FIFO(First-In, First-Out) 방식으로 관리할 수도 있습니다. collections.deque를 사용하여 효율적인 큐 자료구조를 구현할 수 있습니다.

예시:

from collections import deque

class History:
    def __init__(self, max_size=10):
        # 고정 크기의 큐를 사용해 히스토리를 관리
        self.history = deque(maxlen=max_size)

    def add_record(self, timestamp, data):
        # 큐에 기록을 추가 (큐가 꽉 차면 가장 오래된 기록이 제거됨)
        self.history.append((timestamp, data))

    def get_all_records(self):
        # 모든 기록을 반환
        return list(self.history)

# 히스토리 클래스 사용 예시
h = History(max_size=5)
h.add_record("2024-10-22 10:00", {"temperature": 20, "humidity": 50})
h.add_record("2024-10-22 11:00", {"temperature": 21, "humidity": 55})
h.add_record("2024-10-22 12:00", {"temperature": 22, "humidity": 60})

# 모든 기록 조회
print(h.get_all_records())
# 출력: [('2024-10-22 10:00', {'temperature': 20, 'humidity': 50}), ...]

4. 판다스 데이터프레임 (DataFrame)

좀 더 복잡한 시간 기반 데이터를 처리하려면 pandas의 DataFrame을 사용할 수 있습니다. 타임스탬프를 인덱스로 사용해 데이터의 변화를 관리하기에 매우 유용합니다.

예시:

import pandas as pd

class History:
    def __init__(self):
        # 빈 데이터프레임 생성
        self.history = pd.DataFrame(columns=["timestamp", "temperature", "humidity"])

    def add_record(self, timestamp, temperature, humidity):
        # 데이터프레임에 기록 추가
        new_record = pd.DataFrame([[timestamp, temperature, humidity]], 
                                  columns=["timestamp", "temperature", "humidity"])
        self.history = pd.concat([self.history, new_record], ignore_index=True)

    def get_history(self):
        # 전체 히스토리 반환
        return self.history

# 히스토리 클래스 사용 예시
h = History()
h.add_record("2024-10-22 10:00", 20, 50)
h.add_record("2024-10-22 11:00", 21, 55)

# 전체 히스토리 조회
print(h.get_history())

요약:

리스트의 리스트: 간단한 기록 저장에 적합.
딕셔너리의 리스트: 타임스탬프 기반 데이터 저장에 유용.
큐 (deque): 제한된 크기로 기록을 관리할 때 효율적.
판다스 DataFrame: 시간 기반 데이터 분석에 적합.

히스토리 클래스의 복잡도와 성능 요구에 따라 적절한 자료구조를 선택하면 됩니다.

저작자표시 비영리 변경금지 (새창열림)

'다차원 자료구조 응용' 카테고리의 다른 글

[다차원 자료구조 응용] 타임트랙의 다차원 자료구조 예시 (10)	2024.10.27
[다차원 자료구조 응용] 병렬처리에 적합한 다차원 자료구조 모델 (2)	2024.10.24
[다차원 자료구조 응용] 다차원 자료구조 기반의 콘텐츠 추천 시스템 (7)	2024.10.20
[다차원 자료구조 응용] 게임 개발 분야 다차원 자료구조 (16)	2024.10.18
[다차원 자료구조 응용] 컴퓨터 시뮬레이션 분야 다차원 자료구조 (8)	2024.10.18

[다차원 자료구조 생성 및 방법] 다차원 자료구조 표현 도구 텐서(Tensor)

코드수집가 2024. 10. 22. 17:56

2024. 10. 22. 17:56

텐서(Tensor)란?

텐서는 다차원 배열의 일반화된 개념으로, 스칼라(0차원), 벡터(1차원), 행렬(2차원), 그리고 그 이상의 차원을 갖는 다차원 배열을 모두 포괄하는 용어입니다. 주로 머신러닝과 딥러닝에서 데이터를 다룰 때 사용됩니다. 예를 들어, 이미지 데이터는 보통 3차원 텐서로 표현되고, 비디오 데이터는 4차원 텐서로 표현됩니다.

텐서는 물리학, 공학, 컴퓨터 과학 등에서 다루는 다차원 데이터 구조를 효과적으로 표현하는 도구로, 딥러닝에서는 입력 데이터와 가중치 등을 표현하는 데 자주 사용됩니다. 텐서를 사용하면 행렬 연산, 벡터 연산 등을 확장해 다양한 차원에서 계산을 수행할 수 있습니다.

텐서의 차원 설명

0차원 텐서 (스칼라):
- 값 하나만 있는 데이터로, 예를 들어 3과 같은 숫자가 0차원 텐서입니다.
1차원 텐서 (벡터):
- 일렬로 늘어선 값들의 집합입니다. 예를 들어, [1, 2, 3]은 1차원 텐서로, 길이 3인 벡터입니다.
2차원 텐서 (행렬):
- 행과 열로 구성된 데이터 집합입니다. 예를 들어, [[1, 2, 3], [4, 5, 6]]은 2x3 크기의 행렬입니다.
3차원 이상 텐서:
- 3차원부터는 "텐서"라는 용어가 주로 사용됩니다. 예를 들어, RGB 이미지 데이터는 각 픽셀이 (R, G, B) 값으로 구성된 3차원 텐서입니다.
- 3차원 텐서 예시:
  - 3차원 텐서는 높이 × 너비 × 채널과 같은 구조로 데이터가 배열됩니다.
  - 예: [ [ [1, 2], [3, 4] ], [ [5, 6], [7, 8] ] ]는 (2, 2, 2) 크기의 3차원 텐서입니다.
- 4차원 텐서 예시:
  - 4차원 텐서는 보통 배치(batch) × 높이 × 너비 × 채널과 같은 형식으로 사용됩니다.
  - 예: 여러 이미지를 다룰 때, 각 이미지가 3차원 텐서로 나타내어질 수 있고, 이를 묶으면 4차원 텐서가 됩니다.

파이썬에서의 텐서 자료구조

파이썬에서 텐서를 다루는 데 가장 많이 사용하는 라이브러리는 NumPy와 PyTorch, TensorFlow입니다.

NumPy: 과학 계산에서 자주 사용되는 다차원 배열을 다루는 라이브러리로, 딥러닝 모델을 직접 작성할 때 주로 사용되지는 않지만, 기본적인 텐서 연산을 처리하는 데 사용됩니다.
PyTorch: 딥러닝 프레임워크로, 기본적으로 Tensor라는 자료형을 사용하여 다차원 배열을 다룹니다.
TensorFlow: 딥러닝 프레임워크로, Tensor 자료형을 통해 텐서 연산을 수행합니다.

1. `NumPy`에서 텐서 다루기

NumPy는 다차원 배열을 쉽게 만들고 연산할 수 있는 강력한 기능을 제공합니다. 다음은 NumPy를 사용해 텐서를 생성하고 다루는 예시입니다.

텐서 생성

import numpy as np

# 0차원 텐서 (스칼라)
scalar = np.array(42)
print("0차원 텐서 (스칼라):", scalar)

# 1차원 텐서 (벡터)
vector = np.array([1, 2, 3])
print("1차원 텐서 (벡터):", vector)

# 2차원 텐서 (행렬)
matrix = np.array([[1, 2, 3], [4, 5, 6]])
print("2차원 텐서 (행렬):\n", matrix)

# 3차원 텐서
tensor_3d = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print("3차원 텐서:\n", tensor_3d)

텐서의 차원과 크기 확인

# 텐서의 차원 확인
print("3차원 텐서의 차원:", tensor_3d.ndim)

# 텐서의 크기(모양) 확인
print("3차원 텐서의 모양:", tensor_3d.shape)

텐서 연산

NumPy를 사용해 텐서 간의 기본적인 연산을 수행할 수 있습니다.

# 두 텐서 더하기
tensor_1 = np.array([[1, 2], [3, 4]])
tensor_2 = np.array([[5, 6], [7, 8]])

tensor_sum = tensor_1 + tensor_2
print("텐서 더하기 결과:\n", tensor_sum)

# 텐서 곱하기 (요소별 곱셈)
tensor_mul = tensor_1 * tensor_2
print("텐서 곱하기 결과:\n", tensor_mul)

2. `PyTorch`에서 텐서 다루기

PyTorch는 머신러닝과 딥러닝에 많이 사용되는 텐서 기반의 프레임워크입니다.

텐서 생성

import torch

# 0차원 텐서 (스칼라)
scalar = torch.tensor(42)
print("0차원 텐서 (스칼라):", scalar)

# 1차원 텐서 (벡터)
vector = torch.tensor([1, 2, 3])
print("1차원 텐서 (벡터):", vector)

# 2차원 텐서 (행렬)
matrix = torch.tensor([[1, 2, 3], [4, 5, 6]])
print("2차원 텐서 (행렬):\n", matrix)

# 3차원 텐서
tensor_3d = torch.tensor([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print("3차원 텐서:\n", tensor_3d)

텐서 연산

# 텐서 덧셈
tensor_sum = tensor_1 + tensor_2
print("텐서 더하기 결과:\n", tensor_sum)

# 텐서 곱셈
tensor_mul = tensor_1 * tensor_2
print("텐서 곱하기 결과:\n", tensor_mul)

GPU에서 텐서 연산

PyTorch에서는 GPU에서 텐서 연산을 수행할 수 있습니다.

# GPU에서 텐서 생성 및 연산
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
tensor_gpu = torch.tensor([[1, 2], [3, 4]], device=device)

3. `TensorFlow`에서 텐서 다루기

TensorFlow에서도 텐서를 기본 자료형으로 사용합니다.

텐서 생성

import tensorflow as tf

# 0차원 텐서 (스칼라)
scalar = tf.constant(42)
print("0차원 텐서 (스칼라):", scalar)

# 1차원 텐서 (벡터)
vector = tf.constant([1, 2, 3])
print("1차원 텐서 (벡터):", vector)

# 2차원 텐서 (행렬)
matrix = tf.constant([[1, 2, 3], [4, 5, 6]])
print("2차원 텐서 (행렬):\n", matrix)

# 3차원 텐서
tensor_3d = tf.constant([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print("3차원 텐서:\n", tensor_3d)

결론

텐서는 스칼라부터 다차원 배열까지 모든 형태의 데이터 구조를 표현할 수 있는 유연한 자료구조입니다.
파이썬에서는 NumPy, PyTorch, TensorFlow 등의 라이브러리를 사용해 텐서를 다룰 수 있습니다.
텐서 연산은 머신러닝과 딥러닝 알고리즘의 핵심 연산으로, 대규모 데이터를 효과적으로 처리하는 데 필수적입니다.

저작자표시 비영리 변경금지 (새창열림)

'다차원 자료구조 생성 및 방법' 카테고리의 다른 글

[다차원 자료구조 생성 및 방법] 리스트 상속 다차원 자료구조 2 (7)	2024.10.26
[다차원 자료구조 생성 및 방법] 딕셔너리 상속 다차원 자료구조 2 (12)	2024.10.25
[다차원 자료구조 생성 및 방법] 네임드 튜플 `collections` 모듈 자료구조 (11)	2024.10.21
[다차원 자료구조 생성 및 방법] 파이썬에서의 벡터 공간 (4)	2024.10.19
[다차원 자료구조 생성 및 방법] `namedtuple`을 상속한 다차원 자료구조 (0)	2024.10.16

[실용적인 코드 샘플] Way Point기반 시나리오 맵 자료구조

코드수집가 2024. 10. 22. 16:07

2024. 10. 22. 16:07

파이썬에서 Way Point 기반 시나리오 맵 자료구조는 시나리오의 여러 지점을 나타내고 그 지점들 간의 이동 경로를 관리하는 데 사용됩니다. 이를 통해 특정한 경로, 행동, 혹은 이벤트들이 일어나는 위치를 정의할 수 있습니다. 이러한 구조는 특히 게임 개발, 로봇 경로 탐색, 네비게이션 시스템에서 많이 사용됩니다.

Way Point 기반 시나리오 맵 자료구조

Way Point: 지도나 시나리오 상의 특정 지점을 의미하며, 각 지점은 좌표(위치)를 포함할 수 있습니다.
경로(Path): 각 Way Point 간의 연결(Edge)을 나타내며, 두 지점 간의 거리를 포함할 수 있습니다.
시나리오 맵: 여러 Way Point가 연결되어 이루어진 경로 맵으로, 시나리오에서 중요한 위치와 그 간의 이동 경로를 관리합니다.

기본적인 자료구조

노드(Node): 각각의 Way Point를 표현합니다. 위치 정보와 함께 특정 이벤트나 상태를 가질 수 있습니다.
간선(Edge): Way Point 간의 연결을 의미하며, 이 연결을 통해 이동 경로와 거리를 정의할 수 있습니다.

파이썬으로 구현한 Way Point 기반 시나리오 맵 예제

예제 코드

class WayPoint:
    def __init__(self, name, x, y):
        self.name = name        # Way Point 이름
        self.x = x              # X 좌표
        self.y = y              # Y 좌표
        self.connections = {}   # 연결된 다른 Way Point와의 경로(거리)

    def add_connection(self, other_waypoint, distance):
        """다른 Way Point와의 연결 추가"""
        self.connections[other_waypoint] = distance

    def __repr__(self):
        return f"WayPoint({self.name}, ({self.x}, {self.y}))"

class ScenarioMap:
    def __init__(self):
        self.waypoints = {}  # 시나리오 맵의 모든 Way Point를 저장하는 딕셔너리

    def add_waypoint(self, waypoint):
        """새로운 Way Point 추가"""
        self.waypoints[waypoint.name] = waypoint

    def connect_waypoints(self, name1, name2, distance):
        """두 Way Point 간의 연결 추가"""
        if name1 in self.waypoints and name2 in self.waypoints:
            wp1 = self.waypoints[name1]
            wp2 = self.waypoints[name2]
            wp1.add_connection(wp2, distance)
            wp2.add_connection(wp1, distance)

    def get_waypoint(self, name):
        """Way Point 이름으로 해당 지점 가져오기"""
        return self.waypoints.get(name)

    def display_map(self):
        """시나리오 맵을 출력"""
        for wp in self.waypoints.values():
            print(f"{wp} -> {[f'{conn.name} (distance: {dist})' for conn, dist in wp.connections.items()]}")

# 사용 예제
if __name__ == "__main__":
    # ScenarioMap 생성
    scenario_map = ScenarioMap()

    # Way Point 추가
    wp1 = WayPoint("Start", 0, 0)
    wp2 = WayPoint("Point A", 2, 3)
    wp3 = WayPoint("Point B", 4, 7)
    wp4 = WayPoint("End", 8, 5)

    scenario_map.add_waypoint(wp1)
    scenario_map.add_waypoint(wp2)
    scenario_map.add_waypoint(wp3)
    scenario_map.add_waypoint(wp4)

    # Way Point 간 연결 설정
    scenario_map.connect_waypoints("Start", "Point A", 5)
    scenario_map.connect_waypoints("Point A", "Point B", 4)
    scenario_map.connect_waypoints("Point B", "End", 6)
    scenario_map.connect_waypoints("Start", "End", 10)

    # 맵 출력
    scenario_map.display_map()

예제 설명

WayPoint 클래스:
- WayPoint는 각 지점을 나타냅니다. 각 Way Point는 이름(name), X, Y 좌표(x, y), 그리고 연결된 다른 Way Point들과의 연결 정보(connections)를 갖습니다.
- add_connection() 메서드는 현재 Way Point에 다른 Way Point와의 연결을 추가하며, 이때 거리를 포함합니다.
ScenarioMap 클래스:
- 시나리오 전체를 관리하는 클래스입니다. 여러 Way Point를 추가하고, 그 Way Point들 간의 연결을 설정할 수 있습니다.
- add_waypoint()는 새로운 Way Point를 추가하며, connect_waypoints()는 두 지점 간의 연결(경로)과 거리를 설정합니다.
- display_map() 메서드는 각 Way Point와 그 연결 상태를 출력합니다.
경로 설정:
- 각 Way Point는 다른 Way Point와 거리를 기반으로 연결되며, 양방향 경로를 설정하여 이동 가능하게 만듭니다.
거리 기반 경로 연결:
- 두 Way Point 간의 거리를 지정하여 경로를 연결할 수 있으며, 이를 통해 실제 시나리오에서 각 지점 간 이동 가능성을 표현할 수 있습니다.

실행 결과

WayPoint(Start, (0, 0)) -> ['Point A (distance: 5)', 'End (distance: 10)']
WayPoint(Point A, (2, 3)) -> ['Start (distance: 5)', 'Point B (distance: 4)']
WayPoint(Point B, (4, 7)) -> ['Point A (distance: 4)', 'End (distance: 6)']
WayPoint(End, (8, 5)) -> ['Point B (distance: 6)', 'Start (distance: 10)']

주요 포인트

Way Point와 연결 관리:
- 각 Way Point는 다른 Way Point들과 연결되며, 연결된 경로의 거리를 관리합니다. 이를 통해 경로 탐색, 최단 경로 계산 등에 활용할 수 있습니다.
유연한 확장:
- 기본적인 경로 및 지점 관리 외에도 이벤트 발생, 상태 변경, 혹은 특정 조건부 경로 등을 추가하여 시나리오를 확장할 수 있습니다.
응용:
- 게임에서의 경로 탐색 시스템, 물류 시스템에서의 경로 최적화, 로봇 경로 계획, 네비게이션 시스템 등에 활용할 수 있습니다.
확장성:
- 이 기본 구조를 확장하여 경로의 우선순위, 지점 간 조건부 연결, 특정 이벤트 발생 여부 등을 관리할 수 있습니다.

이와 같이 Way Point 기반의 자료구조는 시나리오 맵에서 경로와 지점을 효과적으로 관리할 수 있으며, 다양한 분야에서 유연하게 사용될 수 있습니다.

저작자표시 비영리 변경금지 (새창열림)

'실용적인 코드 샘플' 카테고리의 다른 글

[실용적인 코드 샘플] `object` 클래스를 상속 사용자 정의 데이터 타입 (2)	2024.10.23
[실용적인 코드 샘플] 히스토리 기반 통계 작성 클래스 (8)	2024.10.22
[실용적인 코드 샘플] 메타클래스 기반 게임 설정값 저장 클래스 (1)	2024.10.20
[실용적인 코드 샘플] 리스트 상속 기반 스택(Stack) 자료구조 (3)	2024.10.20
[실용적인 코드 샘플] Singleton 패턴 (클래스 변수, 메타클래스 활용) (2)	2024.10.19

[실용적인 자료구조] 리스트 상속 데이터 직렬화 클래스 (SerializableList)

코드수집가 2024. 10. 22. 14:50

2024. 10. 22. 14:50

파이썬에서 리스트를 상속받아 데이터를 다루는 클래스에 데이터 직렬화(Serialization) 기능을 추가하면, 해당 데이터를 파일에 저장하거나 네트워크로 전송하는 것이 용이해집니다. 직렬화는 데이터 구조를 저장하거나 전송할 때 이를 문자열이나 바이트 스트림으로 변환하는 과정입니다. 파이썬에서는 일반적으로 json, pickle 같은 라이브러리를 사용하여 직렬화 및 역직렬화(Deserialization)를 구현합니다.

이 예제에서는 리스트를 상속한 데이터 구조에 직렬화 기능을 추가해보겠습니다. 여기서는 json을 이용하여 직렬화 및 역직렬화를 구현하는 예제를 살펴보겠습니다.

예제: 파이썬 리스트를 상속한 직렬화 가능한 자료구조

이 예제에서는 SerializableList라는 클래스를 정의하고, 이를 통해 데이터를 리스트처럼 다루면서 직렬화 및 역직렬화 기능을 추가합니다.

예제 코드:

import json

# 리스트를 상속한 직렬화 가능 클래스 정의
class SerializableList(list):
    # 리스트를 JSON 문자열로 직렬화하는 메서드
    def to_json(self):
        return json.dumps(self)

    # JSON 문자열을 받아 리스트로 변환하는 클래스 메서드
    @classmethod
    def from_json(cls, json_str):
        data = json.loads(json_str)
        # JSON에서 파싱한 리스트 데이터를 SerializableList로 반환
        return cls(data)

    # 직렬화된 데이터를 파일로 저장하는 메서드
    def save_to_file(self, filename):
        with open(filename, 'w') as f:
            json.dump(self, f)

    # 파일에서 데이터를 읽어와 역직렬화하는 클래스 메서드
    @classmethod
    def load_from_file(cls, filename):
        with open(filename, 'r') as f:
            data = json.load(f)
            return cls(data)

# 사용 예제
if __name__ == '__main__':
    # SerializableList 객체 생성
    my_list = SerializableList([1, 2, 3, 4, 5])

    # 리스트를 JSON 문자열로 직렬화
    json_str = my_list.to_json()
    print("Serialized JSON String:", json_str)

    # JSON 문자열을 다시 SerializableList로 역직렬화
    new_list = SerializableList.from_json(json_str)
    print("Deserialized List:", new_list)

    # 데이터를 파일로 저장
    my_list.save_to_file('my_list.json')

    # 파일에서 데이터를 읽어와 역직렬화
    loaded_list = SerializableList.load_from_file('my_list.json')
    print("Loaded List from File:", loaded_list)

설명:

SerializableList 클래스:
- 파이썬의 기본 list 클래스를 상속하여 리스트와 같은 기능을 유지하면서, 데이터를 직렬화할 수 있는 추가적인 기능을 제공합니다.
- to_json() 메서드는 리스트 객체를 JSON 문자열로 직렬화합니다.
- from_json() 클래스 메서드는 JSON 문자열을 받아서 이를 다시 SerializableList 객체로 역직렬화합니다.
- save_to_file() 메서드는 리스트 데이터를 파일로 저장합니다.
- load_from_file() 클래스 메서드는 파일에서 데이터를 읽어와 SerializableList 객체로 변환합니다.
JSON 직렬화:
- json.dumps()를 사용하여 리스트 데이터를 JSON 문자열로 변환하고, json.loads()를 사용하여 JSON 문자열을 다시 리스트로 변환합니다.
- json.dump()와 json.load()는 파일에 데이터를 저장하거나 파일로부터 데이터를 읽을 때 사용합니다.
직렬화의 활용:
- 직렬화는 데이터를 쉽게 저장하거나 네트워크로 전송할 수 있게 해줍니다.
- 예를 들어, 리스트 데이터를 다른 프로그램이나 시스템에서 사용할 수 있도록 JSON 형태로 변환하여 전달할 수 있습니다.

실행 결과:

Serialized JSON String: [1, 2, 3, 4, 5]
Deserialized List: [1, 2, 3, 4, 5]
Loaded List from File: [1, 2, 3, 4, 5]

주요 포인트:

리스트 상속: SerializableList 클래스는 list를 상속받았기 때문에 리스트의 모든 기능을 사용할 수 있습니다. 이와 함께 직렬화 관련 메서드가 추가되어 더 많은 기능을 지원합니다.
데이터 직렬화: 직렬화를 통해 데이터를 파일이나 네트워크로 저장하거나 전송할 수 있습니다. JSON 직렬화는 사람이 읽을 수 있는 텍스트 형태로 변환되어 다양한 시스템 간에 데이터를 교환할 수 있는 표준입니다.
유연한 확장성: 리스트에 필요한 추가적인 기능(직렬화, 파일 저장/로드 등)을 쉽게 추가할 수 있으며, 리스트뿐만 아니라 다른 자료구조에도 직렬화 기능을 쉽게 확장할 수 있습니다.

이와 같은 구조는 데이터를 리스트처럼 다루면서, 이를 쉽게 저장하거나 불러와야 하는 웹 애플리케이션, API, 파일 기반 애플리케이션 등에 유용하게 사용할 수 있습니다.

저작자표시 비영리 변경금지 (새창열림)

'실용적인 자료구조' 카테고리의 다른 글

[실용적인 자료구조] 스택(Stack) 자료구조의 설명과 실무 적용 사례 (1)	2024.10.26
[실용적인 자료구조] 메타클래스 설명 및 예제코드 (3)	2024.10.24
[실용적인 자료구조] Python의 'object' 클래스 2 (2)	2024.10.20
[실용적인 자료구조] 게임 Way Point 저장을 위한 자료구조 (11)	2024.10.19
[실용적인 자료구조] 리스트 상속 원형 큐(Circular Queue) 자료구조 (2)	2024.10.18

[데이터카드 자료구조] 데이터 과학 분야에서의 데이터 카드 활용

코드수집가 2024. 10. 22. 13:21

2024. 10. 22. 13:21

데이터 클래스 기반 데이터 카드(Data Card)를 활용하면 데이터를 구조적으로 정의하고, 이를 팀원 간에 공유 및 협업하는 시스템을 쉽게 구축할 수 있습니다. 특히 데이터 과학, 머신러닝 프로젝트, 또는 다른 데이터 집약적 작업에서 협업할 때, 데이터 카드를 통해 데이터셋, 모델, 결과 등을 모듈화하고, 각 데이터를 쉽게 추적, 공유 및 수정할 수 있습니다.

협업 데이터 카드의 주요 개념

데이터의 모듈화: 각각의 데이터 항목을 독립적인 데이터 카드로 만들어, 다른 팀원이 손쉽게 접근하고 수정할 수 있도록 합니다.
공유 가능: 데이터 카드는 JSON과 같은 형식으로 직렬화할 수 있어, 파일 또는 클라우드를 통해 데이터를 쉽게 공유할 수 있습니다.
버전 관리: 데이터 카드는 여러 버전의 데이터를 저장하고 추적할 수 있어, 누가 언제 어떤 데이터를 수정했는지 기록할 수 있습니다.
리뷰 및 검토: 각 데이터 카드의 상태를 확인하고 수정 사항을 검토할 수 있는 시스템을 구축할 수 있습니다.

데이터 카드 응용: 데이터셋 협업 시스템

1. 데이터 카드 정의

데이터셋 협업을 위한 데이터 카드는 데이터셋의 메타정보, 데이터를 생성한 사람, 마지막으로 수정한 사람 등 협업에 필요한 정보를 포함할 수 있습니다.

from dataclasses import dataclass, field
from typing import Dict, Any
import json
from datetime import datetime

@dataclass
class DataCard:
    card_id: int
    name: str
    description: str
    created_by: str
    last_modified_by: str
    created_at: datetime
    last_modified_at: datetime
    data: Dict[str, Any] = field(default_factory=dict)

    # 데이터 카드를 JSON으로 직렬화
    def to_json(self) -> str:
        return json.dumps(self.__dict__, default=str, indent=4)

    # JSON에서 데이터 카드로 역직렬화
    @staticmethod
    def from_json(json_data: str):
        data = json.loads(json_data)
        data['created_at'] = datetime.fromisoformat(data['created_at'])
        data['last_modified_at'] = datetime.fromisoformat(data['last_modified_at'])
        return DataCard(**data)

    # 데이터 카드 업데이트
    def update(self, modified_by: str, new_data: Dict[str, Any]):
        self.last_modified_by = modified_by
        self.last_modified_at = datetime.now()
        self.data.update(new_data)

# 예제 카드 생성
card = DataCard(
    card_id=1,
    name="Customer Segmentation Data",
    description="Data for customer segmentation model training",
    created_by="Alice",
    last_modified_by="Alice",
    created_at=datetime.now(),
    last_modified_at=datetime.now(),
    data={
        "customer_count": 1000,
        "segmentation_model": "k-means",
        "features": ["age", "income", "spending_score"]
    }
)

# JSON으로 직렬화하여 파일로 저장 또는 공유 가능
json_data = card.to_json()
print("데이터 카드의 JSON 표현:")
print(json_data)

# JSON 데이터를 이용해 역직렬화
new_card = DataCard.from_json(json_data)
print("\n역직렬화된 데이터 카드:")
print(new_card)

2. 데이터 카드 공유 및 협업

이 코드는 데이터 카드를 JSON으로 직렬화하여, 파일로 저장하거나 클라우드 기반의 협업 도구 (Google Drive, AWS S3 등)를 통해 쉽게 공유할 수 있도록 합니다. 팀원들은 데이터를 JSON 파일로 받아 로컬에서 복구하거나 새 데이터를 추가할 수 있습니다.

예제:

Alice가 데이터 카드를 만들고 팀에 공유합니다.
Bob이 데이터를 받아서 업데이트합니다.

# Bob이 데이터를 업데이트하는 시나리오
bob_updates = {
    "customer_count": 1200,
    "new_feature": "membership_status"
}
new_card.update(modified_by="Bob", new_data=bob_updates)

# 업데이트된 데이터를 JSON으로 직렬화
updated_json_data = new_card.to_json()
print("\nBob이 업데이트한 데이터 카드의 JSON 표현:")
print(updated_json_data)

3. 버전 관리

협업 중에 데이터가 여러 번 수정되거나 업데이트되는 경우, 버전 관리 시스템을 도입할 수 있습니다. 이를 위해 각 데이터 카드의 수정 기록을 추적할 수 있는 간단한 버전 관리 기능을 추가할 수 있습니다.

@dataclass
class VersionedDataCard:
    card_id: int
    name: str
    description: str
    created_by: str
    created_at: datetime
    versions: Dict[int, DataCard] = field(default_factory=dict)
    current_version: int = 0

    # 새 버전으로 카드 업데이트
    def add_new_version(self, card: DataCard):
        self.current_version += 1
        self.versions[self.current_version] = card

    # 특정 버전의 카드 가져오기
    def get_version(self, version: int) -> DataCard:
        if version in self.versions:
            return self.versions[version]
        else:
            raise ValueError(f"Version {version} not found.")

    # 최신 버전의 카드 가져오기
    def get_latest_version(self) -> DataCard:
        return self.versions[self.current_version]

# 새 버전 카드 생성
versioned_card = VersionedDataCard(
    card_id=1,
    name="Customer Segmentation Data",
    description="Versioned data card for customer segmentation",
    created_by="Alice",
    created_at=datetime.now()
)

# 첫 번째 버전 추가 (Alice)
versioned_card.add_new_version(card)

# Bob이 업데이트한 카드 추가 (새 버전)
versioned_card.add_new_version(new_card)

# 최신 버전 카드 조회
latest_card = versioned_card.get_latest_version()
print("\n최신 버전 데이터 카드:")
print(latest_card)

# 특정 버전 조회 (1번 버전)
first_version_card = versioned_card.get_version(1)
print("\n첫 번째 버전 데이터 카드:")
print(first_version_card)

4. 리뷰 및 검토 시스템

팀 협업에서 중요한 요소는 검토(review)입니다. 각 데이터 카드가 수정될 때, 검토 단계를 거쳐 변경 사항을 확인하고 승인할 수 있습니다. 간단한 리뷰 기능을 추가하여 협업 시 데이터를 수정하거나 업데이트할 때 승인 절차를 구현할 수 있습니다.

@dataclass
class DataCardReview:
    card: DataCard
    review_status: str = "Pending"
    review_comments: str = ""

    # 검토 완료
    def approve(self, comments: str):
        self.review_status = "Approved"
        self.review_comments = comments

    # 검토 거절
    def reject(self, comments: str):
        self.review_status = "Rejected"
        self.review_comments = comments

# Bob이 업데이트한 데이터 카드를 검토
review = DataCardReview(card=new_card)

# 리뷰 승인
review.approve(comments="Looks good. Approved by the team lead.")
print("\n데이터 카드 리뷰 상태:")
print(f"상태: {review.review_status}, 코멘트: {review.review_comments}")

5. 실제 협업 시스템 구축

위의 코드를 기반으로 협업 시스템을 구축할 수 있습니다:

데이터 공유: 데이터 카드를 JSON 파일로 직렬화하여 클라우드 또는 버전 관리 시스템을 통해 팀 간에 공유.
버전 관리: 각 데이터를 수정할 때마다 새 버전을 추가하여 데이터의 변경 이력을 추적.
리뷰 및 승인: 데이터 수정 후 팀 리더가 검토하고 승인 또는 거절하는 프로세스 도입.

요약

데이터 카드는 데이터를 구조화하고 협업을 용이하게 합니다.
JSON 직렬화를 통해 데이터를 손쉽게 파일로 저장하거나 클라우드에서 공유할 수 있습니다.
버전 관리 시스템을 도입해 각 데이터의 변경 이력을 추적할 수 있습니다.
리뷰 시스템을 통해 팀 협업 시 데이터 검토 및 승인 절차를 구현할 수 있습니다.

이 구조는 데이터 과학 프로젝트나 비즈니스 인텔리전스 프로젝트에서 팀 간 협업을 원활하게 진행할 수 있는 강력한 도구가 됩니다.

저작자표시 비영리 변경금지 (새창열림)

'데이터 카드 자료구조' 카테고리의 다른 글

[데이터카드 자료구조] 이벤트 로그를 위한 데이터 카드 자료구조 (0)	2024.10.23
[데이터카드 자료구조] 데이터 카드 자료구조에서의 랜덤 모델 (5)	2024.10.23
[데이터카드 자료구조] 데이터클래스를 활용한 데이터카드 자료구조 (2)	2024.10.22
[데이터카드 자료구조] 문헌정보학에서 파이썬을 활용한 데이터 구조와 처리 (5)	2024.10.21
[데이터 카드 자료구조] 시뮬레이션 분야의 데이터 카드(Data Card) (2)	2024.10.19

[데이터카드 자료구조] 데이터클래스를 활용한 데이터카드 자료구조

코드수집가 2024. 10. 22. 11:59

2024. 10. 22. 11:59

파이썬의 데이터 클래스(data class)는 간단한 데이터 구조를 효율적으로 정의할 수 있도록 도와주는 기능입니다. 파이썬 3.7부터 제공되는 @dataclass 데코레이터를 사용하면, 불필요한 반복 코드를 최소화하면서 자동으로 생성자, __repr__, __eq__와 같은 메서드들을 생성해 줍니다. 이를 통해 데이터를 카드 형태로 저장하고 관리하는 자료구조를 쉽게 구현할 수 있습니다.

데이터 클래스를 활용하면 각 데이터 카드가 간결하고 구조화된 형태로 관리될 수 있습니다. 데이터 클래스는 자동으로 데이터를 초기화하고, 비교 연산, 출력을 더 쉽게 해줍니다.

데이터 클래스 기반 데이터 카드 자료구조

데이터 클래스의 장점:

자동 생성자: 인스턴스 변수를 쉽게 정의할 수 있습니다.
가독성 향상: 데이터 중심 클래스를 더 간결하게 작성할 수 있습니다.
비교 연산 지원: 기본적으로 객체 간의 비교를 지원합니다.
유효성 검사: field를 사용하여 기본값을 설정하거나, 값에 대해 유효성 검사를 추가할 수 있습니다.

데이터 클래스 예제

데이터 카드 구조를 다음과 같이 정의할 수 있습니다.

from dataclasses import dataclass, field
from typing import List, Dict, Any

@dataclass
class DataCard:
    card_id: int
    name: str
    description: str
    attributes: Dict[str, Any] = field(default_factory=dict)

# 예제 카드 생성
card1 = DataCard(
    card_id=1,
    name="Customer Data",
    description="This card contains customer information",
    attributes={
        "age": 30,
        "purchase_amount": 150.75,
        "is_premium_member": True
    }
)

card2 = DataCard(
    card_id=2,
    name="Order Data",
    description="This card contains order information",
    attributes={
        "order_id": "ORD1234",
        "product": "Laptop",
        "price": 999.99
    }
)

print(card1)
print(card2)

출력 결과:

DataCard(card_id=1, name='Customer Data', description='This card contains customer information', attributes={'age': 30, 'purchase_amount': 150.75, 'is_premium_member': True})
DataCard(card_id=2, name='Order Data', description='This card contains order information', attributes={'order_id': 'ORD1234', 'product': 'Laptop', 'price': 999.99})

이렇게 @dataclass를 활용하면 간단한 데이터 카드를 쉽게 정의할 수 있으며, 각 카드에는 고유한 ID, 이름, 설명, 속성 등이 포함됩니다.

데이터 카드 리스트 및 카드 덱 구현

데이터 카드 리스트와 카드 덱을 데이터 클래스를 활용하여 관리할 수 있습니다. 이를 통해 여러 개의 카드를 그룹화하거나 카드 컬렉션을 관리할 수 있습니다.

카드 리스트 및 카드 덱 클래스

@dataclass
class CardDeck:
    deck_name: str
    cards: List[DataCard] = field(default_factory=list)

    def add_card(self, card: DataCard):
        self.cards.append(card)

    def get_card_by_id(self, card_id: int) -> DataCard:
        for card in self.cards:
            if card.card_id == card_id:
                return card
        raise ValueError(f"Card with ID {card_id} not found.")

    def display_cards(self):
        for card in self.cards:
            print(card)

# 카드 리스트 및 카드 덱 생성
card_deck = CardDeck(deck_name="Customer Orders")

# 카드 추가
card_deck.add_card(card1)
card_deck.add_card(card2)

# 카드 출력
card_deck.display_cards()

# 특정 카드 ID로 조회
card = card_deck.get_card_by_id(1)
print(f"\n조회한 카드: {card}")

출력 결과:

DataCard(card_id=1, name='Customer Data', description='This card contains customer information', attributes={'age': 30, 'purchase_amount': 150.75, 'is_premium_member': True})
DataCard(card_id=2, name='Order Data', description='This card contains order information', attributes={'order_id': 'ORD1234', 'product': 'Laptop', 'price': 999.99})

조회한 카드: DataCard(card_id=1, name='Customer Data', description='This card contains customer information', attributes={'age': 30, 'purchase_amount': 150.75, 'is_premium_member': True})

주요 기능 설명:

DataCard 클래스:
- 개별 카드(데이터)에 대한 정보를 저장하는 클래스입니다.
- 각 카드는 고유한 ID, 이름, 설명, 그리고 속성(attribute)을 가집니다. 속성은 dict 타입으로 다양한 형태의 데이터를 저장할 수 있습니다.
CardDeck 클래스:
- 여러 개의 DataCard를 그룹화하여 관리하는 클래스입니다.
- add_card() 메서드는 새로운 카드를 카드 덱에 추가하며, get_card_by_id() 메서드는 카드의 ID로 특정 카드를 찾습니다.
- display_cards() 메서드는 카드 덱에 있는 모든 카드를 출력합니다.

데이터 클래스의 활용 이점

간결함: 반복적인 코드를 줄여 가독성을 높입니다. 생성자와 같은 기본 메서드를 자동으로 생성하므로 클래스 정의가 간결해집니다.
유연성: default_factory를 사용해 속성에 기본값을 쉽게 설정할 수 있습니다.
타입 힌트: dataclass는 typing 모듈과 함께 사용하여 더 명확한 타입 힌트를 제공합니다. 이는 IDE와 협력해 자동 완성 및 타입 체크 기능을 강화합니다.
디버깅 편리함: __repr__ 메서드가 자동으로 제공되므로 객체의 상태를 쉽게 출력하고 확인할 수 있습니다.

추가 기능: 카드 업데이트 및 삭제

데이터 카드나 카드 덱을 다루는 데 추가적으로 필요한 업데이트 및 삭제 기능도 쉽게 구현할 수 있습니다.

@dataclass
class CardDeck:
    deck_name: str
    cards: List[DataCard] = field(default_factory=list)

    def add_card(self, card: DataCard):
        self.cards.append(card)

    def remove_card_by_id(self, card_id: int):
        self.cards = [card for card in self.cards if card.card_id != card_id]

    def update_card(self, card_id: int, new_card: DataCard):
        for i, card in enumerate(self.cards):
            if card.card_id == card_id:
                self.cards[i] = new_card
                return
        raise ValueError(f"Card with ID {card_id} not found.")

    def get_card_by_id(self, card_id: int) -> DataCard:
        for card in self.cards:
            if card.card_id == card_id:
                return card
        raise ValueError(f"Card with ID {card_id} not found.")

이 코드를 활용하면 데이터를 추가, 수정, 삭제하는 더 많은 기능을 지원할 수 있습니다.

요약

데이터 클래스는 파이썬에서 데이터를 구조화하는 데 매우 유용한 도구입니다.
@dataclass 데코레이터를 사용하면 간단한 데이터 구조를 쉽게 정의하고 관리할 수 있습니다.
데이터 카드를 정의하고, 카드 리스트 및 카드 덱 구조를 만들어 데이터를 그룹화하고 관리할 수 있습니다.
이를 통해 데이터셋, 머신러닝 모델, 게임 카드 등을 관리하는 구조를 유연하고 간결하게 만들 수 있습니다.

저작자표시 비영리 변경금지 (새창열림)

'데이터 카드 자료구조' 카테고리의 다른 글

[데이터카드 자료구조] 데이터 카드 자료구조에서의 랜덤 모델 (5)	2024.10.23
[데이터카드 자료구조] 데이터 과학 분야에서의 데이터 카드 활용 (5)	2024.10.22
[데이터카드 자료구조] 문헌정보학에서 파이썬을 활용한 데이터 구조와 처리 (5)	2024.10.21
[데이터 카드 자료구조] 시뮬레이션 분야의 데이터 카드(Data Card) (2)	2024.10.19
[데이터 카드 자료구조] 데이터 카드 리스트 클래스 1 (2)	2024.10.17

[확률 분포 생성 및 방법] 확률 분포 클래스 3

코드수집가 2024. 10. 22. 11:46

2024. 10. 22. 11:46

메타 클래스를 활용한 이산 확률 분포 클래스는 연속 확률 분포에서와 마찬가지로 확률 분포 클래스에 공통적인 기능을 동적으로 추가하거나, 클래스를 정의할 때 특정 조건을 검증하는 방법으로 사용할 수 있습니다. 이산 확률 분포에서는 확률 질량 함수(PMF, Probability Mass Function)와 누적 분포 함수(CDF, Cumulative Distribution Function)가 주로 사용됩니다.

이 예제에서는 이산 확률 분포 클래스에 대해 메타 클래스를 활용하여 다음과 같은 작업을 수행합니다:

분포 클래스 생성 제약: 이산 확률 분포 클래스에 반드시 pmf (확률 질량 함수)와 cdf (누적 분포 함수)를 구현하도록 강제합니다.
공통 기능 추가: 이산 확률 분포 클래스들에 공통적인 기능을 자동으로 추가합니다.

예제: 메타 클래스를 활용한 이산 확률 분포 클래스

1. 메타 클래스 정의

먼저, 모든 이산 확률 분포가 pmf와 cdf 메서드를 반드시 구현하도록 강제하는 메타 클래스를 정의합니다.

# 메타 클래스 정의
class DiscreteDistributionMeta(type):
    def __init__(cls, name, bases, dct):
        super().__init__(name, bases, dct)

        # 이산 확률 분포 클래스는 pmf와 cdf 메서드를 반드시 구현해야 함
        if not all(hasattr(cls, method) for method in ['pmf', 'cdf']):
            raise TypeError(f"{name} 클래스는 'pmf'와 'cdf' 메서드를 반드시 포함해야 합니다.")

2. 기본 이산 확률 분포 클래스 정의

모든 이산 확률 분포 클래스는 pmf와 cdf 메서드를 구현해야 하며, 이를 구현하지 않으면 NotImplementedError가 발생합니다.

# 이산 확률 분포의 기본 클래스
class DiscreteProbabilityDistribution(metaclass=DiscreteDistributionMeta):
    def pmf(self, x):
        """확률 질량 함수 (PMF)를 반환합니다."""
        raise NotImplementedError("pmf() 메서드가 구현되어 있지 않습니다.")

    def cdf(self, x):
        """누적 분포 함수 (CDF)를 반환합니다."""
        raise NotImplementedError("cdf() 메서드가 구현되어 있지 않습니다.")

3. 구체적인 이산 확률 분포 클래스 구현

이제 메타 클래스와 기본 클래스를 바탕으로 베르누이 분포와 이항 분포와 같은 구체적인 이산 확률 분포 클래스를 정의합니다.

베르누이 분포: 두 가지 결과(성공/실패)를 가지는 확률 분포.
이항 분포: 여러 번의 베르누이 시행에서 성공 횟수를 따르는 확률 분포.

1) 베르누이 분포 (Bernoulli Distribution) 클래스

import numpy as np

class BernoulliDistribution(DiscreteProbabilityDistribution):
    def __init__(self, p):
        """
        p: 성공 확률 (0 <= p <= 1)
        """
        self.p = p

    def pmf(self, x):
        """베르누이 분포의 PMF: P(X=x) = p^x * (1-p)^(1-x)"""
        if x not in [0, 1]:
            return 0  # 이산 확률 분포에서 0과 1 이외의 값은 0의 확률을 가짐
        return self.p if x == 1 else 1 - self.p

    def cdf(self, x):
        """베르누이 분포의 CDF"""
        if x < 0:
            return 0
        elif x < 1:
            return 1 - self.p
        else:
            return 1

# 베르누이 분포 예제
bern_dist = BernoulliDistribution(p=0.6)
print(f"Bernoulli PMF at x=1: {bern_dist.pmf(1)}")
print(f"Bernoulli PMF at x=0: {bern_dist.pmf(0)}")
print(f"Bernoulli CDF at x=1: {bern_dist.cdf(1)}")

2) 이항 분포 (Binomial Distribution) 클래스

class BinomialDistribution(DiscreteProbabilityDistribution):
    def __init__(self, n, p):
        """
        n: 시행 횟수
        p: 성공 확률
        """
        self.n = n
        self.p = p

    def pmf(self, k):
        """이항 분포의 PMF: P(X=k) = nCk * p^k * (1-p)^(n-k)"""
        from scipy.special import comb
        if k < 0 or k > self.n:
            return 0
        return comb(self.n, k) * (self.p ** k) * ((1 - self.p) ** (self.n - k))

    def cdf(self, k):
        """이항 분포의 CDF"""
        cdf_value = 0
        for i in range(0, k + 1):
            cdf_value += self.pmf(i)
        return cdf_value

# 이항 분포 예제
binom_dist = BinomialDistribution(n=5, p=0.5)
print(f"Binomial PMF at k=3: {binom_dist.pmf(3)}")
print(f"Binomial CDF at k=3: {binom_dist.cdf(3)}")

4. 오류가 발생하는 경우

만약 pmf와 cdf 메서드를 구현하지 않고 클래스를 정의하려고 하면, 메타 클래스가 정의된 대로 TypeError가 발생합니다.

# 잘못된 분포 클래스 예시 (pmf와 cdf 미구현)
class InvalidDistribution(DiscreteProbabilityDistribution):
    pass

# 이 코드는 TypeError를 발생시킴
# InvalidDistribution 클래스는 pmf, cdf 메서드가 없으므로 오류 발생

설명

DiscreteDistributionMeta 메타 클래스:
- 이 메타 클래스는 클래스가 정의될 때 pmf와 cdf 메서드를 가지고 있는지 확인합니다.
- 이산 확률 분포에서 pmf(확률 질량 함수)와 cdf(누적 분포 함수)를 반드시 정의해야 한다는 제약을 적용합니다.
DiscreteProbabilityDistribution 클래스:
- 이산 확률 분포의 기본 클래스로, 이 클래스를 상속받는 모든 분포는 pmf와 cdf 메서드를 구현해야 합니다.
- 기본 클래스에서 이 두 메서드를 정의하지 않으면 NotImplementedError를 발생시켜, 추상 클래스 역할을 합니다.
구체적인 이산 분포 클래스 (베르누이 분포, 이항 분포):
- BernoulliDistribution 클래스는 베르누이 분포를 구현하고, pmf와 cdf 메서드를 제공합니다.
- BinomialDistribution 클래스는 이항 분포를 구현하고, 이 역시 pmf와 cdf 메서드를 제공합니다.
클래스 생성 시 제약:
- pmf와 cdf를 구현하지 않은 이산 분포 클래스를 만들면 TypeError가 발생하여 클래스를 정의할 수 없습니다.

실행 결과

Bernoulli PMF at x=1: 0.6
Bernoulli PMF at x=0: 0.4
Bernoulli CDF at x=1: 1
Binomial PMF at k=3: 0.3125
Binomial CDF at k=3: 0.8125
TypeError: InvalidDistribution 클래스는 'pmf'와 'cdf' 메서드를 반드시 포함해야 합니다.

요약

이 예제에서는 메타 클래스를 활용하여 이산 확률 분포 클래스를 정의할 때, pmf와 cdf 메서드를 반드시 구현하도록 강제했습니다. 이를 통해 확률 분포 클래스 설계에서 일관성을 유지하고, 확률 분포 클래스에 공통된 기능을 적용할 수 있습니다.

저작자표시 비영리 변경금지 (새창열림)

'확률 분포 생성 및 방법' 카테고리의 다른 글

[확률 분포 생성 및 방법] 딕셔너리 기반 희소 행렬(Sparse Matrix) (4)	2024.10.26
[확률 분포 생성 및 방법] 확률 통계 생성 목적 데이터 자료구조 (2)	2024.10.25
[확률 분포 생성 및 방법] 확률 분포 클래스 2 (0)	2024.10.20
[확률 분포 생성 및 방법] 연속 확률 분포 설명 및 예제 코드 (1)	2024.10.19
[확률 분포 생성 및 방법] 이산 확률 분포 (0)	2024.10.17

[마이크로 웹 프레임워크] 플라스크 소개 및 예제 2

코드수집가 2024. 10. 22. 11:10

2024. 10. 22. 11:10

파이썬 Flask에서 세션, 로그인, 로그아웃 구현

Flask는 간단하고 유연한 파이썬 웹 프레임워크로, 세션 관리 및 사용자 인증 기능을 쉽게 구현할 수 있습니다. 이 기능을 활용하여 웹 애플리케이션에서 로그인, 로그아웃을 구현하고 사용자의 상태를 관리할 수 있습니다.

1. Flask 세션이란?

세션(session)은 클라이언트가 웹 애플리케이션에 접속한 후, 서버에서 클라이언트와의 상호작용 상태를 유지하기 위한 저장 공간입니다. Flask에서는 session 객체를 사용하여 세션 데이터를 저장할 수 있으며, 이 데이터는 클라이언트의 쿠키에 저장됩니다. Flask는 쿠키의 무결성을 보장하기 위해 비밀 키(Secret Key)를 사용하여 세션 데이터를 서명합니다.

2. Flask-Login이란?

Flask-Login은 Flask 애플리케이션에서 사용자 로그인, 로그아웃, 세션 관리 등을 쉽게 구현할 수 있는 확장 라이브러리입니다. 주로 사용자의 인증 및 세션 관리를 다룹니다.

주요 기능:

사용자 로그인 및 로그아웃 관리
사용자 세션 유지 (로그인 상태)
로그인하지 않은 사용자에 대한 페이지 접근 제한
Remember Me 기능을 통한 지속적인 로그인 세션

설치

pip install flask flask-login

3. 기본 Flask 세션 및 로그인 예제

다음은 기본적인 Flask에서의 세션과 로그인, 로그아웃 구현 예제입니다.

from flask import Flask, render_template, redirect, url_for, request, session, flash
from flask_login import LoginManager, UserMixin, login_user, login_required, logout_user, current_user

app = Flask(__name__)

# 세션을 위한 비밀 키 설정
app.secret_key = 'your_secret_key'

# Flask-Login 설정
login_manager = LoginManager()
login_manager.init_app(app)
login_manager.login_view = 'login'  # 로그인 페이지 경로 설정

# 사용자 정보를 담을 가상의 사용자 데이터베이스 (딕셔너리 형태로 간단히 구현)
users = {
    'admin': {'password': 'secret'}
}

# 사용자 클래스를 정의
class User(UserMixin):
    def __init__(self, username):
        self.id = username

# Flask-Login은 사용자를 로드하는 함수 필요
@login_manager.user_loader
def load_user(username):
    if username in users:
        return User(username)
    return None

# 홈 페이지
@app.route('/')
@login_required
def home():
    return f'Hello, {current_user.id}! You are logged in.'

# 로그인 페이지
@app.route('/login', methods=['GET', 'POST'])
def login():
    if request.method == 'POST':
        username = request.form['username']
        password = request.form['password']

        # 사용자 인증
        if username in users and users[username]['password'] == password:
            user = User(username)
            login_user(user)  # 로그인 처리
            flash('Logged in successfully!')
            return redirect(url_for('home'))  # 로그인 후 홈으로 이동
        else:
            flash('Invalid username or password')  # 잘못된 로그인 정보

    return render_template('login.html')

# 로그아웃 처리
@app.route('/logout')
@login_required
def logout():
    logout_user()  # Flask-Login에서 제공하는 로그아웃 함수
    flash('You have been logged out.')
    return redirect(url_for('login'))

# 로그인 상태에서만 접근 가능한 페이지
@app.route('/protected')
@login_required
def protected():
    return 'This is a protected page. Only logged-in users can see this.'

# 서버 실행
if __name__ == '__main__':
    app.run(debug=True)

4. 코드 설명

1. Flask 기본 설정

app = Flask(__name__)
app.secret_key = 'your_secret_key'  # 세션을 위한 비밀 키

Flask 애플리케이션을 생성하고, 세션 데이터 보호를 위해 secret_key를 설정합니다. 이 키는 세션 데이터를 서명하여 조작되지 않도록 보호합니다.

2. Flask-Login 설정

login_manager = LoginManager()
login_manager.init_app(app)
login_manager.login_view = 'login'

Flask-Login의 인스턴스를 생성하고, Flask 애플리케이션에 등록합니다. login_view는 로그인하지 않은 사용자가 접근할 수 없는 페이지에 접근할 때 리디렉션될 로그인 페이지 경로입니다.

3. 사용자 클래스 정의 (UserMixin)

class User(UserMixin):
    def __init__(self, username):
        self.id = username

Flask-Login은 UserMixin을 사용하는 User 클래스를 요구합니다. 이 클래스는 로그인한 사용자의 ID를 관리하고 UserMixin을 상속받아 여러 유틸리티 메서드를 사용할 수 있습니다.

4. 로그인 사용자 로드 함수

@login_manager.user_loader
def load_user(username):
    if username in users:
        return User(username)
    return None

Flask-Login은 사용자 정보를 세션에서 가져오기 위해 사용자 로딩 함수가 필요합니다. 이 함수는 사용자 ID를 사용해 사용자를 데이터베이스에서 가져옵니다.

5. 로그인 처리

@app.route('/login', methods=['GET', 'POST'])
def login():
    if request.method == 'POST':
        username = request.form['username']
        password = request.form['password']

        # 사용자 인증
        if username in users and users[username]['password'] == password:
            user = User(username)
            login_user(user)
            flash('Logged in successfully!')
            return redirect(url_for('home'))
        else:
            flash('Invalid username or password')

    return render_template('login.html')

로그인 페이지는 GET 요청 시 화면에 표시됩니다.
POST 요청 시, 사용자 입력 정보를 통해 인증을 수행하고, 인증 성공 시 login_user()를 통해 세션을 시작합니다.

6. 로그아웃 처리

@app.route('/logout')
@login_required
def logout():
    logout_user()  # Flask-Login에서 제공하는 로그아웃 함수
    flash('You have been logged out.')
    return redirect(url_for('login'))

logout_user()를 호출하여 사용자의 세션을 종료합니다.

7. 로그인 필수 데코레이터 (`@login_required`)

@app.route('/protected')
@login_required
def protected():
    return 'This is a protected page. Only logged-in users can see this.'

@login_required 데코레이터를 사용하여 로그인한 사용자만 접근할 수 있는 페이지를 정의할 수 있습니다. 로그인하지 않은 사용자가 이 페이지에 접근하려고 하면 login_view로 리디렉션됩니다.

5. 로그인 페이지 템플릿 (login.html)

로그인 화면을 위한 간단한 HTML 템플릿입니다.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Login</title>
</head>
<body>
    <h2>Login</h2>
    <form method="POST" action="/login">
        <label for="username">Username:</label>
        <input type="text" name="username" id="username" required>
        <br>
        <label for="password">Password:</label>
        <input type="password" name="password" id="password" required>
        <br>
        <button type="submit">Login</button>
    </form>

    {% with messages = get_flashed_messages() %}
      {% if messages %}
        <ul>
        {% for message in messages %}
          <li>{{ message }}</li>
        {% endfor %}
        </ul>
      {% endif %}
    {% endwith %}
</body>
</html>

설명:

사용자 이름과 비밀번호를 입력받고 POST 요청으로 로그인 폼을 제출합니다.
로그인 시 오류가 있으면 Flash 메시지를 통해 사용자에게 알립니다.

결론

이 예제에서는 Flask 세션과 Flask-Login을 사용하여 로그인과 로그아웃 기능을 구현하는 방법을 다뤘습니다. Flask-Login은 로그인한 사용자 세션을 관리하고, 로그인하지 않은 사용자가 접근할 수 없는 페이지를 보호하는 데 매우 유용합니다. 비동기 작업이나 데이터베이스 연동 등과 함께 사용할 수 있으며, 더 복잡한 인증 시스템을 구현할 때 매우 유용한 도구입니다.

추가적으로 구현하고 싶은 기능이나 질문이 있으면 언제든지 알려주세요!

저작자표시 비영리 변경금지 (새창열림)

'마이크로 웹 프레임워크' 카테고리의 다른 글

[마이크로 웹 프레임워크] Flask를 이용한 통계 서버 1 (0)	2025.02.09
[마이크로 웹 프레임워크] FastAPI 마이크로 웹 프레임워크 2 (3)	2024.10.26
[마이크로 웹 프레임워크] 파이썬 Sanic 프레임워크란? (0)	2024.10.20
[마이크로 웹 프레임워크] Falcon 고성능 웹 프레임워크 1 (4)	2024.10.19
[마이크로 웹 프레임워크] FastAPI 마이크로 웹 프레임워크 1 (2)	2024.10.18

[다차원 자료구조 생성 및 방법] 네임드 튜플 `collections` 모듈 자료구조

코드수집가 2024. 10. 21. 20:28

2024. 10. 21. 20:28

파이썬에서 네임드 스페이스(namedtuple)는 collections 모듈에 있는 자료구조로, 튜플과 비슷하지만 필드에 이름을 붙일 수 있는 구조입니다. 즉, 일반적인 튜플처럼 값의 위치에 의존하지 않고, 필드 이름으로 값에 접근할 수 있게 해줍니다. 네임드 스페이스(namedtuple)는 데이터 구조를 더 읽기 쉽게 만들고, 특히 간단한 데이터를 표현할 때 유용합니다.

1. 네임드 스페이스(namedtuple) 설명

namedtuple은 주로 다음과 같은 상황에서 유용합니다:

간단한 불변 데이터 구조를 정의할 때
클래스 정의 없이 필드 이름으로 데이터에 접근하고 싶을 때
메모리 효율적인 방식으로 데이터를 저장해야 할 때 (튜플 기반)

주요 특징

불변성: 네임드 스페이스는 기본적으로 튜플과 동일하게 불변(immutable)합니다. 값을 생성한 후에는 수정할 수 없습니다.
필드명 접근: 필드명을 통해 값에 접근할 수 있습니다. 위치(index)로도 접근 가능합니다.

2. 네임드 스페이스(namedtuple) 예제 코드

기본 사용법

from collections import namedtuple

# 네임드 스페이스 생성: 도서(Book) 구조
Book = namedtuple('Book', ['title', 'author', 'publisher', 'year'])

# 도서 인스턴스 생성
book1 = Book(title="Introduction to Information Science", 
             author="David Bawden", 
             publisher="Facet Publishing", 
             year=2015)

book2 = Book(title="Python for Data Analysis", 
             author="Wes McKinney", 
             publisher="O'Reilly Media", 
             year=2017)

# 필드명으로 접근
print(f"Title: {book1.title}, Author: {book1.author}, Year: {book1.year}")
print(f"Title: {book2.title}, Author: {book2.author}, Publisher: {book2.publisher}")

# 튜플처럼 인덱스로 접근
print(book1[0], book1[1])  # Introduction to Information Science, David Bawden

출력 결과:

Title: Introduction to Information Science, Author: David Bawden, Year: 2015
Title: Python for Data Analysis, Author: Wes McKinney, Publisher: O'Reilly Media
Introduction to Information Science David Bawden

3. 네임드 스페이스 사용의 장점

간결함: 클래스를 정의할 필요 없이 데이터를 쉽게 구조화할 수 있습니다.
가독성: 위치(index)로 값을 참조하는 대신, 이름을 사용해 데이터 필드에 접근할 수 있어 코드의 가독성이 높아집니다.
효율성: 일반 클래스에 비해 메모리 효율적이며, 튜플의 성능을 그대로 유지합니다.

필드 접근 예시

namedtuple을 사용하면 필드를 이름으로 참조할 수 있어 직관적입니다.

# 필드 이름으로 값 변경 (불가능)
# book1.title = "New Title"  # AttributeError: can't set attribute

# 새로운 인스턴스를 통해 값 변경
book3 = book1._replace(title="New Title")
print(f"Updated Title: {book3.title}, Original Title: {book1.title}")

결과:

Updated Title: New Title, Original Title: Introduction to Information Science

4. 네임드 스페이스의 활용

도서관의 메타데이터 관리, 데이터베이스 행을 표현하거나, 일시적인 데이터 구조에 사용할 수 있습니다. 특히 문헌정보학과 같은 분야에서 각 도서나 논문의 메타데이터를 관리할 때, 네임드 스페이스를 활용하면 간편하고 효율적으로 데이터를 다룰 수 있습니다.

예시: 도서관의 도서 데이터 관리

# 도서 여러 권을 리스트로 관리
library_catalog = [
    Book(title="Introduction to Information Science", author="David Bawden", publisher="Facet Publishing", year=2015),
    Book(title="Python for Data Analysis", author="Wes McKinney", publisher="O'Reilly Media", year=2017),
    Book(title="The Elements of Statistical Learning", author="Trevor Hastie", publisher="Springer", year=2009)
]

# 특정 연도 이후 출판된 도서 검색
for book in library_catalog:
    if book.year > 2010:
        print(f"Title: {book.title}, Year: {book.year}")

5. 결론

네임드 스페이스(namedtuple)는 간단한 불변 데이터 구조를 만드는 데 매우 유용하며, 필드명을 사용해 데이터에 접근할 수 있어 가독성이 높은 코드를 작성할 수 있습니다. 이는 문헌정보학 분야에서 데이터를 다루고 처리하는 데 효율적인 방법이 될 수 있습니다.

저작자표시 비영리 변경금지 (새창열림)

'다차원 자료구조 생성 및 방법' 카테고리의 다른 글

[다차원 자료구조 생성 및 방법] 딕셔너리 상속 다차원 자료구조 2 (12)	2024.10.25
[다차원 자료구조 생성 및 방법] 다차원 자료구조 표현 도구 텐서(Tensor) (2)	2024.10.22
[다차원 자료구조 생성 및 방법] 파이썬에서의 벡터 공간 (4)	2024.10.19
[다차원 자료구조 생성 및 방법] `namedtuple`을 상속한 다차원 자료구조 (0)	2024.10.16
[다차원 자료구조 생성 및 방법] 딕셔너리 상속 다차원 자료구조 1 (0)	2024.10.16

[데이터카드 자료구조] 문헌정보학에서 파이썬을 활용한 데이터 구조와 처리

코드수집가 2024. 10. 21. 20:13

2024. 10. 21. 20:13

문헌정보학(Library and Information Science)에서 파이썬(Python)을 활용한 데이터 구조와 처리 기술은 데이터를 효율적으로 저장, 관리 및 검색하는 데 중요한 역할을 합니다. 이 중에서 카드 자료구조는 데이터를 항목별로 정리하는 방식으로, 도서관 카탈로그나 메타데이터 관리와 같은 작업에 적용될 수 있습니다.

카드 자료구조는 도서의 기본 정보를 저장하고 검색할 수 있도록 설계된 하나의 레코드 단위를 말합니다. 파이썬에서는 이를 딕셔너리(Dict) 구조로 구현할 수 있으며, 리스트(List)나 클래스를 사용하여 여러 도서 정보를 관리할 수 있습니다.

1. 카드 자료구조 설명

개념

카드 자료구조는 각 항목(책의 제목, 저자, 출판사, 발행연도 등)을 속성으로 가지는 도서 레코드를 저장합니다. 이러한 구조는 도서관의 카탈로그 시스템이나 전산화된 메타데이터 저장소에서 도서를 검색하거나 필터링할 때 유용합니다.

구성 요소

도서 제목: title
저자: author
출판사: publisher
발행연도: year
ISBN: isbn
키워드: keywords

2. 카드 자료구조 예제 코드

파이썬에서 카드 자료구조는 리스트와 딕셔너리를 조합하여 구현할 수 있습니다. 리스트는 여러 도서 레코드를 저장하고, 딕셔너리는 각 도서의 세부 정보를 저장합니다.

# 카드 자료구조: 도서 정보를 딕셔너리로 구현
card_catalog = [
    {
        "title": "Introduction to Information Science",
        "author": "David Bawden",
        "publisher": "Facet Publishing",
        "year": 2015,
        "isbn": "9781783300764",
        "keywords": ["information science", "library", "data management"]
    },
    {
        "title": "Python for Data Analysis",
        "author": "Wes McKinney",
        "publisher": "O'Reilly Media",
        "year": 2017,
        "isbn": "9781491957660",
        "keywords": ["python", "data science", "data analysis"]
    }
]

# 도서 목록 출력
for book in card_catalog:
    print(f"Title: {book['title']}")
    print(f"Author: {book['author']}")
    print(f"Publisher: {book['publisher']}")
    print(f"Year: {book['year']}")
    print(f"ISBN: {book['isbn']}")
    print(f"Keywords: {', '.join(book['keywords'])}")
    print("-" * 40)

3. 기능 추가

추가적으로, 데이터를 필터링하거나 검색하는 기능을 구현할 수 있습니다. 예를 들어, 키워드를 기반으로 도서를 검색하는 코드를 작성할 수 있습니다.

키워드 검색 기능 구현

# 키워드를 기반으로 도서 검색
def search_by_keyword(catalog, keyword):
    result = []
    for book in catalog:
        if keyword.lower() in [k.lower() for k in book['keywords']]:
            result.append(book)
    return result

# 'python' 키워드를 포함하는 도서 검색
keyword = "python"
search_results = search_by_keyword(card_catalog, keyword)

# 검색 결과 출력
if search_results:
    print(f"Books with keyword '{keyword}':")
    for book in search_results:
        print(f"- {book['title']} by {book['author']}")
else:
    print(f"No books found with keyword '{keyword}'.")

4. 설명

이 코드에서는 card_catalog라는 리스트에 여러 도서의 정보를 딕셔너리 형태로 저장했습니다. 각 도서는 제목, 저자, 출판사, 발행연도, ISBN, 키워드 정보를 포함하고 있으며, 이 구조는 실제 도서관에서의 카드 자료구조와 유사한 방식으로 데이터를 저장합니다.

검색 기능은 키워드를 기준으로 도서 목록에서 관련 도서를 찾아 반환합니다.

저작자표시 비영리 변경금지 (새창열림)

'데이터 카드 자료구조' 카테고리의 다른 글

[데이터카드 자료구조] 데이터 과학 분야에서의 데이터 카드 활용 (5)	2024.10.22
[데이터카드 자료구조] 데이터클래스를 활용한 데이터카드 자료구조 (2)	2024.10.22
[데이터 카드 자료구조] 시뮬레이션 분야의 데이터 카드(Data Card) (2)	2024.10.19
[데이터 카드 자료구조] 데이터 카드 리스트 클래스 1 (2)	2024.10.17
[데이터카드 자료구조] 딕셔너리 상속 데이터카드 클래스 (12)	2024.10.17

PREV 이전 1 ···8 9 10 11 12 13 14 ···19 NEXT 다음