kaggle-Otto Group Product Classification Challenge

网站

代码

import torch
import pandas as pd
import matplotlib.pyplot as plt
from torch.utils.data import Dataset, DataLoader


class OttoDataset(Dataset):
    def __init__(self, filepath):
        df = pd.read_csv(filepath)
        df.drop('id', axis=1, inplace=True)
        self.len = df.shape[0]
        self.x_data = df.loc[:, df.columns != 'target'].values
        self.y_data = df.target.astype('category').cat.codes.values

    def __getitem__(self, index):
        return self.x_data[index], self.y_data[index]

    def __len__(self):
        return self.len


train_df = OttoDataset('./dataset/otto-group-product-classification-challenge/train.csv')
train_loader = DataLoader(dataset=train_df, batch_size=64, shuffle=True, num_workers=0)


class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.linear1 = torch.nn.Linear(93, 64)
        self.linear2 = torch.nn.Linear(64, 32)
        self.linear3 = torch.nn.Linear(32, 16)
        self.linear4 = torch.nn.Linear(16, 9)
        self.relu = torch.nn.ReLU()

    def forward(self, x):
        x = self.relu(self.linear1(x))
        x = self.relu(self.linear2(x))
        x = self.relu(self.linear3(x))
        return self.linear4(x)

    def predict(self, x):
        with torch.no_grad():
            x = self.relu(self.linear1(x))
            x = self.relu(self.linear2(x))
            x = self.relu(self.linear3(x))
            x = self.relu(self.linear4(x))
            # 这里先取出最大概率的索引，即是所预测的类别。
            predicted = torch.max(x, dim=1)[1]
            # 将预测的类别转为one-hot表示，方便保存为预测文件。
            y = pd.get_dummies(predicted)
            return y


model = Net()
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
cpu_device = torch.device("cpu")
model.to(device)
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

epoch_list = []
loss_list = []


def train(epoch):
    print("epoch:", epoch + 1, end=" ")
    running_loss = 0
    for batch_idx, (inputs, target) in enumerate(train_loader):
        inputs, target = inputs.to(device), target.to(device)
        inputs = inputs.float()
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, target.long())
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        # if batch_idx % 300 == 0 and batch_idx != 0:
        #     print('[%d, %5d] loss: %.3f' % (epoch + 1, batch_idx, running_loss / 300))
        #     running_loss = 0
    print(running_loss)
    epoch_list.append(epoch)
    loss_list.append(running_loss)


if __name__ == "__main__":
    for epoch in range(100):
        train(epoch)
    plt.plot(epoch_list, loss_list)
    plt.ylabel('loss')
    plt.xlabel('epoch')
    plt.show()

    model.to(cpu_device)
    test_df = pd.read_csv('./dataset/otto-group-product-classification-challenge/test.csv')
    inputs = torch.tensor(test_df.loc[:, test_df.columns != 'id'].values).float()
    outputs = model.predict(inputs)
    labels = ['Class_1', 'Class_2', 'Class_3', 'Class_4', 'Class_5', 'Class_6', 'Class_7', 'Class_8', 'Class_9']
    outputs.columns = labels
    outputs.insert(0, 'id', test_df['id'])
    outputs = pd.DataFrame(outputs)
    outputs.to_csv('./otto_dataset/my_predict' + str(min(loss_list)) + '.csv', index=False)